本文抽出 Objective-C ライブラリ
本文抽出 Objective-C ライブラリ オリジナルでは抽出後のテキストにタグが含まれるなどの問題があったためRuby版と同じくタグ除去した状態のテキストが取得できるように修正しました。
RegexKitLiteは内蔵しました。
ビルドしてExtractContent.frameworkをプロジェクトに取り込んでください。 ExtractContent.hをインポートしてhtml文字列をanalyse関数に投げてください。
nisin
オリジナルはnoppefoxwolf
Copyright (C) 2016 noppefoxwolf. All rights reserved.
objective-C版 Copyright (C) 2016 noppefoxwolf. All rights reserved.
Ruby版 Copyright (c) 2007/2008 Nakatani Shuyo / Cybozu Labs Inc. All rights reserved.
- ruby ver https://github.com/mono0x/extractcontent
- java ver https://github.com/tabachain/extractrontent
- js ver https://github.com/hatena/extract-content-javascript
MIT License