twitteRを久しぶりに使用したら文字化けしていた件
R言語でtwitteRを使用している場合、以下の条件で文字化けします。
そしてこの文字化けしたデータはiconvで修復できない 原因 以下のバグを修正したのが原因 Problems with non UTF-8 and ASCII characters twitteR package in R comm.R twFromJSON = function(json) { これは取得したJSONデータでUTF-8に変換できない文字を削除しています。 Windows(日本語)の場合、cp932からutf8に変更してしまうのです。 そして、subを指定して変更できない文字は全部消してしまうので、もとに戻すことはできません。 対策 1. 1.1.6に戻す。以下からダウンロード http://cran.r-project.org/src/contrib/Archive/twitteR/ 2. 1.1.7のソースでさっきのiconvをコメントアウトする なお、以下のページから開発中のコードを取得できるが、大きく修正をいれようとしていて、不安定そうなので今の時点では、やめたほうがいい。 https://github.com/geoffjentry/twitteR パッケージのビルド いづれの対策の場合でも、ソースコードをビルドしてインストールするひつようがある。 rcmd INSTALL --build -l ライブラリをおいているのパス パッケージのパス このコマンドはコマンドプロンプトから実行する必要がある。rcmdは"C:\Program Files\R\R-3.1.2\bin\x64\Rcmd.exe"に存在する ※32bitの場合はC:\Program Files\R\R-3.1.2\bin\i386 2014/12/17 以下の方法で最新をいれても文字化けは解消されます。 http://qiita.com/mima_ita/items/192df262a89af1f6932c
by mima_ita
| 2013-11-29 20:25
| R
|
by mima_ita 検索
カテゴリ
全体
実験 VBA 泣き言 管理 メンタルヘルス memo buildbot php テスト subversion book JQuery python R .NET box2d SQLSERVER node.js ruby 未分類 最新の記事
以前の記事
2014年 07月
2014年 06月 2014年 05月 2014年 04月 2013年 12月 2013年 11月 2013年 10月 2013年 09月 2013年 07月 2013年 06月 2013年 05月 2013年 03月 2012年 10月 2012年 09月 2012年 08月 2012年 04月 2012年 02月 2012年 01月 2011年 10月 最新のトラックバック
その他のジャンル
ブログパーツ
|
|||||||||||||||||||||||||||||||||||||||
ファン申請 |
||