攝影或3C

Python: pandas.Series.str.split( pat=”\s+|\t”, expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame?

test.txt內容如下:

第一列最後的a之後,故意多兩個空白

Q1: 如何分辨分隔子是tab還是不定數空白?

Q2: 如何讀取tab與不定數空白混用的csv?

Q3: 如何用pandas.Series.str.split()

將Series依據分隔子(tab與不定數空白混用)

拆分為多欄的DataFrame?

Q1 & Q2:

df的第0列出現三個 \t

第一列則無

可以據此分辨

tab與不定數空白

雖然df只有一欄而已

仍須注意其type為DataFrame

需要將df轉為Series

才能使用

pandas.Series.str.split( pat = “\s+|\t“, expand=True, n=3 )

使用 ser = df.iloc[:,0] 轉換:

或者df[0] 也可,

0為column name:

#df[[0]]則為DataFrame,

#內層的[]是list的意思

df_split = ser.str.split( pat =”\s+|\t“,expand=True)

正則表示法:

\s+ 不定數空白

\t TAB鍵

| 或

df_split

df_split_n3

可以看出參數n=3的差異

str type的變數,

參數使用sep (非pat)

且不支援正則表示法:

df_split.to_excel(r”C:\temp\df_split.xlsx”)：

最後一欄為空

Python中顯示None ” (空字串):

多加一個參數n=3

df_split_n3.to_excel(r”C:\temp\df_split_n3.xlsx”)

沒有出現最後一個空欄了

但a後面有多餘的空白

也就是剩下沒切割的

都堆在最後一欄

Python中顯示:

如果想要處理多餘的空白

df_split_n3.iloc[:, -1].str.strip()

pandas官網說明(點此或下圖連結):

儲蓄保險王

儲蓄險是板主最喜愛的儲蓄工具,最喜愛的投資理財工具則是ETF,最喜愛的省錢工具則是信用卡

Next Python:如何確保只有單欄資料的變數,其型態是 pandas.Series 而非單欄的DataFrame? pandas.DataFrame.squeeze() ; df.set_index() 將兩欄的df,其中一欄設為index後,其型態是單欄的DataFrame還是Series? »

Previous « Python: matplotlib繪圖, ax.plot (pandas.Series, pandas.DataFrame) 一次畫出多條折線圖; fig, ax = plt.subplots() #一次創建fig, ax兩個物件 ; fig = plt.figure() ; ax = fig.add_subplot(1, 1, 1) #fig, ax 分兩次建立 ; ax = df.plot()

如何設定OPENAI_API_KEY 每月使用上限？如何將 OPENAI_API_KEY 永久存在環境變數？setx OPENAI_API_KEY …

OpenAI platform...

4 天 ago

攝影或3C

Python `json.loads` 的 `strict=True / False` 快速指南 \n vs \\n ; \t vs \\t 那一個是合法json?

`json.loads()` ...

2 週 ago

攝影或3C

Python typing.TypedDict vs typing.NamedTuple 教學; from typing import NamedTuple, TypedDict

## 1. 一句話總結 ## ...

3 週 ago

攝影或3C

Python `typing.NamedTuple` (`collections.namedtuple`) 與 `typing.Literal` 教學 — 用型別「防止錯配」; StripRule = NamedTuple(“StripRule”, [(“regex”, re.Pattern), (“flag”, str)]) vs StripRule = namedtuple(“StripRule”, [“regex”, “flag”])

> **主要目的:防止錯...

3 週 ago

攝影或3C

Python容器複雜度評估（Container Complexity Evaluation）：BFS（Breadth-First Search，廣度優先）層寬統計與 DFS（Depth-First Search，深度優先）Leaf 計數 #遞迴

## 1) 兩個核心指標在算什...

3 週 ago

攝影或3C

Python Caller Name (呼叫者函數名) 教學：sys._getframe(1) vs inspect.currentframe().f_back # inspect.currentframe() 先拿到自己，再 .f_back 到 caller；等價於 sys._getframe(1)

這份文件示範如何在錯誤 hel...

4 週 ago

Python: pandas.Series.str.split( pat=”\s+|\t”, expand=True, n=3 ) ; 如何將Series依據分隔子(tab與不定數空白混用) 拆分為多欄的DataFrame?

Related Post

Recent Posts

如何設定OPENAI_API_KEY 每月使用上限？如何將 OPENAI_API_KEY 永久 存在環境變數？setx OPENAI_API_KEY …

Python `json.loads` 的 `strict=True / False` 快速指南 \n vs \\n ; \t vs \\t 那一個是合法json?

Python typing.TypedDict vs typing.NamedTuple 教學; from typing import NamedTuple, TypedDict

Python `typing.NamedTuple` (`collections.namedtuple`) 與 `typing.Literal` 教學 — 用型別「防止錯配」; StripRule = NamedTuple(“StripRule”, [(“regex”, re.Pattern), (“flag”, str)]) vs StripRule = namedtuple(“StripRule”, [“regex”, “flag”])

Python容器複雜度評估（Container Complexity Evaluation）：BFS（Breadth-First Search，廣度優先）層寬統計與 DFS（Depth-First Search，深度優先）Leaf 計數 #遞迴

Python Caller Name (呼叫者函數名) 教學：sys._getframe(1) vs inspect.currentframe().f_back # inspect.currentframe() 先拿到自己，再 .f_back 到 caller；等價於 sys._getframe(1)

如何設定OPENAI_API_KEY 每月使用上限？如何將 OPENAI_API_KEY 永久存在環境變數？setx OPENAI_API_KEY …