Python: pandas.Series.str.split( pat=”\s+|\t”, expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame?

by 儲蓄保險王 · 2023-04-29

test.txt內容如下:

Python: pandas.Series.str.split( pat="s+|t", expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame? - 儲蓄保險王

第一列最後的a之後,故意多兩個空白

Q1: 如何分辨分隔子是tab還是不定數空白?

Q2: 如何讀取tab與不定數空白混用的csv?

Q3: 如何用pandas.Series.str.split()

將Series依據分隔子(tab與不定數空白混用)

拆分為多欄的DataFrame?

Q1 & Q2:

Python: pandas.Series.str.split( pat="s+|t", expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame? - 儲蓄保險王

df的第0列出現三個 \t

第一列則無

可以據此分辨

tab與不定數空白

雖然df只有一欄而已

仍須注意其type為DataFrame

需要將df轉為Series

才能使用

pandas.Series.str.split( pat = “\s+|\t“, expand=True, n=3 )

使用 ser = df.iloc[:,0] 轉換:

Python: pandas.Series.str.split( pat="s+|t", expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame? - 儲蓄保險王

或者df[0] 也可,

0為column name:

#df[[0]]則為DataFrame,

#內層的[]是list的意思

Python: pandas.Series.str.split( pat="s+|t", expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame? - 儲蓄保險王

df_split = ser.str.split( pat =”\s+|\t“,expand=True)

正則表示法:

\s+ 不定數空白

\t TAB鍵

| 或

Python: pandas.Series.str.split( pat="s+|t", expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame? - 儲蓄保險王

df_split

df_split_n3

可以看出參數n=3的差異

str type的變數,

參數使用sep (非pat)

且不支援正則表示法:

Python: pandas.Series.str.split( pat="s+|t", expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame? - 儲蓄保險王

df_split.to_excel(r”C:\temp\df_split.xlsx”)：

Python: pandas.Series.str.split( pat="s+|t", expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame? - 儲蓄保險王

最後一欄為空

Python中顯示None ” (空字串):

Python: pandas.Series.str.split( pat="s+|t", expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame? - 儲蓄保險王

多加一個參數n=3

df_split_n3.to_excel(r”C:\temp\df_split_n3.xlsx”)

Python: pandas.Series.str.split( pat="s+|t", expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame? - 儲蓄保險王

沒有出現最後一個空欄了

但a後面有多餘的空白

也就是剩下沒切割的

都堆在最後一欄

Python中顯示:

Python: pandas.Series.str.split( pat="s+|t", expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame? - 儲蓄保險王

如果想要處理多餘的空白

df_split_n3.iloc[:, -1].str.strip()

Python: pandas.Series.str.split( pat="s+|t", expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame? - 儲蓄保險王

pandas官網說明(點此或下圖連結):

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Python: pandas.Series.str.split( pat=”\s+|\t”, expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame?

You may also like...

發佈留言取消回覆

hahow

近期文章

分類

近期留言

熱門討論

FB粉絲團

瀏覽量

月曆

Python: pandas.Series.str.split( pat=”\s+|\t”, expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame?

You may also like...

Python: 如何批量將檔案更名?os.rename(old_name, new_name) ; glob.glob() #讀取資料夾中的所有檔案 ; os.path.split(fpath) = os.path.dirname(fpath) , os.path.basename(fpath) ; os.path.splitext(basename) #分離主/副檔名

Python 自省 (Introspection) 實戰：教你如何讓程式碼「自我介紹」; func_name = sys._getframe().f_code.co_name ; inspect.currentframe().f_code.co_name

Python data = numpy.zeros( (4,6,2), dtype=float) ; print(data.shape); min0 = numpy.min(a,axis=0) ; min1 = numpy.min(a,axis=1) #2次沿軸1 ; numpy.average() ;array的軸向

發佈留言 取消回覆

hahow

近期文章

分類

近期留言

熱門討論

FB粉絲團

瀏覽量

月曆

發佈留言取消回覆