[python] 爬蟲遇到 'cp950' codec can't encode ?

爬蟲時,想將資料輸出到txt檔案遇到 cp950 等錯誤資訊,為什麼及該怎麼解決?

遇到類似下面的情況嗎?

這主要原因為某個字元因為不是 code page 950 (cp950) 內有的字,而無法編碼寫進檔案裡面。python 預設就是Unicode序列。在存檔案時,python會檢查命令提示字元的編碼頁(此為 cp950 )做為檔案預設編碼頁,將 uncidoe 字串皆轉為 cp950,若此時有字不在 cp950 內的話,就會出現此錯誤。

主要解法如下:

一、修改python程式,在open檔案時多一個輸入參數,讓讀寫檔案的編碼方式為 utf-8。

留言

這個網誌中的熱門文章

[RDP] Windows10設定遠端多人多工

[Hyper-V] 讓 Windows 可以吃到超過 16TB 的硬碟!