Python - 以 Python 可以使用的格式編碼外來字符的方法? (Python - Way to encode foreign characters in format Python can work with?)


問題描述

Python ‑ 以 Python 可以使用的格式編碼外來字符的方法? (Python ‑ Way to encode foreign characters in format Python can work with?)

我正在處理法語和德語的大文件。基本上,將字符串從一個文件寫入另一個文件,從中收集數據等等。不幸的是,我不知道要導入什麼來讓 Python 處理這些字符。

即使從 Python 已經轉換的文件中收集數據(在法語中,你會得到奇怪的東西,比如 écouteur ça ),在檢查我 知道 已經放置在該字典中的東西的字典時,我會遇到關鍵錯誤,但只有當項目中包含特殊字符時,例如 écouteur ça .

例如,當元組 ('écouteur', 'ça') 被添加到收集任何給定單詞對一起出現的頻率的字典中時,


## 參考解法 #### 方法 1:

"Unicode in Python, Completely Demystified"

(by GeorginaIgnacio Vazquez‑Abrams)

參考文件

  1. Python ‑ Way to encode foreign characters in format Python can work with? (CC BY‑SA 3.0/4.0)

#character-encoding #string #Python #Dictionary






相關問題

android webview顯示windows-1250字符集html的問題 (Trouble with android webview displaying windows-1250 charset html)

SQL Server 2008:字符編碼 (SQL Server 2008 : Character encoding)

刪除不可打印的字符 (Removing non-printable character)

電子郵件客戶端如何讀取內容類型標頭進行編碼? (How does an email client read the content-type headers for encoding?)

帶有 iText 7 的 PDF 中的希臘字符 (Greek characters in PDF with iText 7)

如何在 C 字符串中的文本或字母中添加下標字符? (How to add a subscript character to text or a letter in a C string?)

來自 URL 編碼問題的 NSArray (NSArray from URL encoding problem)

網絡上有免費提供的 HTML URL 編碼功能嗎?(在 C 中實現) (Is there any HTML URL encoding function freely available on web?? (Implementation in C))

讀取未知編碼的文本行 (Reading lines of text in unknown encoding)

Python - 以 Python 可以使用的格式編碼外來字符的方法? (Python - Way to encode foreign characters in format Python can work with?)

決定 HTTP 標頭的字符集。我應該簡單地把 utf-8 和 fuggedaboutit 放在一起嗎? (Deciding charset for HTTP Headers. Should i simply put utf-8 and fuggedaboutit?)

如何在 python 中將原始 unicode 轉換為 utf8-unicode? (How to convert raw unicode to utf8-unicode in python?)







留言討論