問題描述
Python ‑ 以 Python 可以使用的格式編碼外來字符的方法? (Python ‑ Way to encode foreign characters in format Python can work with?)
我正在處理法語和德語的大文件。基本上,將字符串從一個文件寫入另一個文件,從中收集數據等等。不幸的是,我不知道要導入什麼來讓 Python 處理這些字符。
即使從 Python 已經轉換的文件中收集數據(在法語中,你會得到奇怪的東西,比如 écouteur ça ),在檢查我 知道 已經放置在該字典中的東西的字典時,我會遇到關鍵錯誤,但只有當項目中包含特殊字符時,例如 écouteur ça .
例如,當元組 ('écouteur', 'ça') 被添加到收集任何給定單詞對一起出現的頻率的字典中時,
## 參考解法 #### 方法 1:
"Unicode in Python, Completely Demystified"
(by Georgina、Ignacio Vazquez‑Abrams)