攝影或3C

python 正則表示法的量詞: *(0個以上) +(1個以上) ?(0 or 1個) 與貪婪/非貪婪, ? 的多重角色（量詞、非貪婪修飾、語法）

1) 量詞 +、*、? 的基本行為

常見坑：findall(r”a*”, “aaa”) 會包含空字串（零次也算匹配）

2) 貪婪 vs 非貪婪（量詞加 ? 變非貪婪）

兩個標記之間取內容

更穩定的替代：用否定類別避免災難回溯

[^Y]* 表示「連續吃所有不是 Y 的字元」，一旦遇到 Y 就停，線性掃描、回溯很少

3) 跨行匹配與「.」

要依據換行符號切割,也可使用
multiline.splitlines()

正則表達式中的「.」用法說明：

基本功能：
「.」是萬用字元，預設匹配除換行符號（\n）以外的任意單一字元，包括字母、數字、符號和空格。

換行處理：
預設情況下「.」不匹配換行符號。如果需要匹配包含換行的任意字元，可以使用 re.DOTALL 旗標（簡寫為 re.S）或內聯旗標 (?s)。

字面句點匹配：
要匹配字面上的句點符號，必須使用反斜線轉義：\.。在字元類別 [.] 中，句點會自動被視為字面字元，無需轉義。

數量控制：

． 只匹配一個字元
.* 匹配零個或多個字元（貪婪模式）
.*? 匹配零個或多個字元（非貪婪模式）

效能建議：
避免過度使用 .*，特別是在大文本中。可以使用更精確的字元類別（如 [a-zA-Z0-9]）或邊界錨點。處理多行文本時，除了使用 re.S 旗標外，也可考慮 [\s\S] 作為替代方案。

實用範例：

4) ? 的多重角色（量詞、非貪婪修飾、語法）

量詞：a? -> 0 或 1 次
非貪婪：*?、+?、??、{m,n}?
語法（不是量詞）：(?:…) 非捕獲群組、(?=…) 先行、(?!…) 否定先行、(?P<name>…) 命名群組

小例：小數點部分可選（非捕獲群組）

5) 用 re.split 做「符號切分 + 解析」

小結

量詞預設貪婪；加 ? 變非貪婪。
優先用明確類別和邊界（如 [^Y]*）抑制過吃。
跨行要用 re.S 或 [\s\S]。
抽取數字前做最小標準化，之後正則與 token 兩路並行更穩定。

儲蓄保險王

儲蓄險是板主最喜愛的儲蓄工具,最喜愛的投資理財工具則是ETF,最喜愛的省錢工具則是信用卡

Next Python 正則表示法：零寬斷言實戰指南 (?=pattern) 正向先行 ; (?!pattern) 負向先行 ; (?<=pattern) 正向回顧 ; (?<!pattern) 負向回顧 ; (? 往後(右)看 ; (?< 往前(左)看 ; =必須符合 ; !不可符合 »

Previous « Python 正則表示法中 ?: 與非捕獲群組的精要筆記, ?的多重語義:量詞0 or 1次, +?非貪婪量詞, ?:非捕獲群組, ?P<name> 命名捕獲組, ?= 正向前瞻斷言, ?! 負向前瞻斷言

如何設定OPENAI_API_KEY 每月使用上限？如何將 OPENAI_API_KEY 永久存在環境變數？setx OPENAI_API_KEY …

OpenAI platform...

4 天 ago

攝影或3C

Python `json.loads` 的 `strict=True / False` 快速指南 \n vs \\n ; \t vs \\t 那一個是合法json?

`json.loads()` ...

2 週 ago

攝影或3C

Python typing.TypedDict vs typing.NamedTuple 教學; from typing import NamedTuple, TypedDict

## 1. 一句話總結 ## ...

3 週 ago

攝影或3C

Python `typing.NamedTuple` (`collections.namedtuple`) 與 `typing.Literal` 教學 — 用型別「防止錯配」; StripRule = NamedTuple(“StripRule”, [(“regex”, re.Pattern), (“flag”, str)]) vs StripRule = namedtuple(“StripRule”, [“regex”, “flag”])

> **主要目的:防止錯...

3 週 ago

攝影或3C

Python容器複雜度評估（Container Complexity Evaluation）：BFS（Breadth-First Search，廣度優先）層寬統計與 DFS（Depth-First Search，深度優先）Leaf 計數 #遞迴

## 1) 兩個核心指標在算什...

3 週 ago

攝影或3C

Python Caller Name (呼叫者函數名) 教學：sys._getframe(1) vs inspect.currentframe().f_back # inspect.currentframe() 先拿到自己，再 .f_back 到 caller；等價於 sys._getframe(1)

這份文件示範如何在錯誤 hel...

4 週 ago

python 正則表示法的量詞: *(0個以上) +(1個以上) ?(0 or 1個) 與貪婪/非貪婪, ? 的多重角色（量詞、非貪婪修飾、語法）

1) 量詞 +、*、? 的基本行為

2) 貪婪 vs 非貪婪（量詞加 ? 變非貪婪）

3) 跨行匹配與「.」

4) ? 的多重角色（量詞、非貪婪修飾、語法）

5) 用 re.split 做「符號切分 + 解析」

Related Post

Recent Posts

如何設定OPENAI_API_KEY 每月使用上限？如何將 OPENAI_API_KEY 永久 存在環境變數？setx OPENAI_API_KEY …

Python `json.loads` 的 `strict=True / False` 快速指南 \n vs \\n ; \t vs \\t 那一個是合法json?

Python typing.TypedDict vs typing.NamedTuple 教學; from typing import NamedTuple, TypedDict

Python `typing.NamedTuple` (`collections.namedtuple`) 與 `typing.Literal` 教學 — 用型別「防止錯配」; StripRule = NamedTuple(“StripRule”, [(“regex”, re.Pattern), (“flag”, str)]) vs StripRule = namedtuple(“StripRule”, [“regex”, “flag”])

Python容器複雜度評估（Container Complexity Evaluation）：BFS（Breadth-First Search，廣度優先）層寬統計與 DFS（Depth-First Search，深度優先）Leaf 計數 #遞迴

Python Caller Name (呼叫者函數名) 教學：sys._getframe(1) vs inspect.currentframe().f_back # inspect.currentframe() 先拿到自己，再 .f_back 到 caller；等價於 sys._getframe(1)

如何設定OPENAI_API_KEY 每月使用上限？如何將 OPENAI_API_KEY 永久存在環境變數？setx OPENAI_API_KEY …