ikm-opengraph.gemをリリースしてみた
リリースしてみた。初gem。forkだけど。
opengraphという、HTMLのヘッダに埋め込まれたOGPの情報を抜き出すgemがあるんだけど、内部で使用しているRESTClientがUTF-8固定で処理をするためにそれ以外のエンコーディングだと文字化けしてしまうという問題があった。
代わりにFaradayを使ってみたらASCII-8BITで処理をしてくれたのでこれまた内部のNokogiriがcharsetからうまくエンコーディングを判定してくれるようになった。なのでまぁ試しにリリースしてみた。
ソースはgithubに上げている。元のopengraphはrspecのバージョンが古かったりしたのでging-opengraphからフォークして、テストも書いてみた。
ただ世の中にはcharsetにEUC-JPと書いてあるけど実際はUTF-8で記述されているページがあったりしたので、結局手元ではrchardet19を使って判定するようにした。重いのが玉に瑕。