儲蓄保險王 - Page 2 of 167 - 透視各家儲蓄險IRR,踢爆保險黑心貨與偽專家,看見儲蓄險的美麗與陷阱

儲蓄保險王 Blog

Python PyMuPDF fitz 教學：從pdf中抓文字、抓 fonts、抓表格; pip install PyMuPDF ; import fitz ; text_dict = page.get_text("dict") #type(page) is pymupdf.Page ; blocks:list[dict] = text_dict['blocks'] ; page.find_tables().tables [0].extract() ;如何判斷粗體字? - 儲蓄保險王

2026-05-26

Python PyMuPDF fitz 教學：從pdf中抓文字、抓 fonts、抓表格; pip install PyMuPDF ; import fitz ; text_dict = page.get_text(“dict”) #type(page) is pymupdf.Page ; blocks:list[dict] = text_dict[‘blocks’] ; page.find_tables().tables [0].extract() ;如何判斷粗體字?

這份教學以一份可重現的示範 PDF 為基礎： – 示範 ...

Python用 yield 拆解 PDF：在 PyMuPDF / fitz 中優雅走訪 block、line、span - 儲蓄保險王

2026-05-26

Python用 yield 拆解 PDF：在 PyMuPDF / fitz 中優雅走訪 block、line、span

– 用 `fitz` 讀 PDF – 逐 p...

別把中文洗掉：Python `isalnum()` vs `[^A-Za-z0-9]` 含/不含 CJK中日韓 - 儲蓄保險王

2026-05-24

別把中文洗掉：Python `isalnum()` vs `[^A-Za-z0-9]` 含/不含 CJK中日韓

這篇的目的很直接：幫你判斷在 token 清洗時，什麼情況該用 `i...

Python unicodedata 小教室：把 `café` 變成 `cafe`，因為大家搜尋時只會打 `cafe` ; import unicodedata ; normalized = unicodedata.normalize("NFKD", text) ; "".join(ch for ch in normalized if not unicodedata.combining(ch)) - 儲蓄保險王

2026-05-21

Python unicodedata 小教室：把 `café` 變成 `cafe`，因為大家搜尋時只會打 `cafe` ; import unicodedata ; normalized = unicodedata.normalize(“NFKD”, text) ; “”.join(ch for ch in normalized if not unicodedata.combining(ch))

`import unicodedata` 主要就是拿來做「去掉重音符...

argparse 超簡單教學：讓 Python 小工具聽懂你的指令; parser = argparse .ArgumentParser() ; parser.add_argument("-name") ; args = parser.parse_args() - 儲蓄保險王

攝影或3C / 未分類

2026-05-20

argparse 超簡單教學：讓 Python 小工具聽懂你的指令; parser = argparse .ArgumentParser() ; parser.add_argument(“–name”) ; args = parser.parse_args()

# argparse 超簡單教學：讓 Python 小工具聽懂你的指...

Python `os.environ["PATH"]`（設定 *.exe 路徑）vs `sys.path`（設定 *.py 路徑）教學：用 Whisper 與 ffmpeg 看懂兩種很像的 path - 儲蓄保險王

2026-05-12

Python `os.environ[“PATH”]`（設定 .exe 路徑）vs `sys.path`（設定 .py 路徑）教學：用 Whisper 與 ffmpeg 看懂兩種很像的 path

這篇教學要講的是一個很常混在一起的觀念： – `os.e...

Python / VS Code UTF-8 BOM (Byte Order Mark) 教學; Path .read_text( encoding = "utf-8-sig") ; `Ctrl+Shift+P` => `Preferences: Open User Settings (JSON)` => "files.encoding": "utf8" - 儲蓄保險王

2026-05-12

Python / VS Code UTF-8 BOM (Byte Order Mark) 教學; Path .read_text( encoding = “utf-8-sig”) ; `Ctrl+Shift+P` => `Preferences: Open User Settings (JSON)` => “files.encoding”: “utf8”

這篇教學整理這次在 `get_class_in_jsons_47.p...

Python: 用兩階段 Regex 拆解 CamelCase、 Acronym 與數字 Token: Himalia4FWGenUUID4ProcessStep_2 - 儲蓄保險王

2026-05-05

Python: 用兩階段 Regex 拆解 CamelCase、 Acronym 與數字 Token: Himalia4FWGenUUID4ProcessStep_2

`Himalia4FWGenUUID4ProcessStep_2` ...

Python 正規表達式教學：看懂 re.split()、W|_ 與 flags=re.ASCII # w代表 word character ~ [A-Za-z0-9_] - 儲蓄保險王

2026-04-29

Python 正規表達式教學：看懂 re.split()、\W|_ 與 flags=re.ASCII # \w代表 word character ~ [A-Za-z0-9_]

這篇會用 Python re 模組來講清楚三個很常一起出現、卻也很...

Python 實戰：用 jieba + Normalize + N-gram 穩定抓出 Family 名稱 ; re.sub(r'[^a-z0-9]+', '', s.lower()) #全部轉小寫 #移除非英數字元 - 儲蓄保險王

2026-04-27

Python 實戰：用 jieba + Normalize + N-gram 穩定抓出 Family 名稱 ; re.sub(r'[^a-z0-9]+’, ”, s.lower()) #全部轉小寫 #移除非英數字元

目標很明確：從混雜中文、英文、符號的文字中，穩定找出已知的 Fam...

阿腸網頁設計