2017-11-11から1日間の記事一覧

PythonでWebページからテキストのみを抽出する

またQiitaに投稿しました。 qiita.com HTML内のテキストのみを取り出すということは結構前からやろうとしていました。以前はjavascriptで正規表現を使って、タグと特定のタグ(scriptとstyle)で囲まれた文章を取り除くという方法でやっていましたが、今回はそ…