pythonオリンピック

オリンピックが楽しみです

xvideosのリンク切れ・削除された動画の自動チェック

今回は、xvidoesのリンク切れまたは削除された動画の自動チェック方法についてご紹介したいと思います。

結論: スクレイピングが必要

動画のページへアクセスし、特定のタグ内に表示されているエラー文字列にて削除されたかを判断します。
たったこれだけです。

では、具体的にどの部分にエラーメッセージが存在しているのかをご紹介します。

self.movie_id = "該当動画のID"
url = "http://www.xvideos.com/video%s/" % self.movie_id
soup = BeautifulSoup(requests.open(url).text)
movie_soup = soup.findAll("div", attrs={"id":"main"})

divタグに設定されている main IDにデータが存在するか否かで判断できます。
なので

if not movie_soup:
   movie_delete(url)

このような感じで、データベースに格納されている動画を削除します。
基本的にはバッチで動画削除をチェックしていくような感じになるかと思います。

※2016年12月22日現在の情報です。今後、HTMLに変更がある場合は、また調査が必要となります。

以上です。