![](http://oshiete.xgoo.jp/images/v2/pc/qa/question_title.png?5a7ff87)
Pythonのスクレイピングの質問です。
こちらのランキングサイトから
clickCntが10000以上のタイトルをもってこようとしてます。(clickが1万以上のもの)
R18サイトになります↓
https://movie.eroterest.net/popular/?days=1
実際にコードを書いたのですが、このように
clickCntが10000以下のタイトルを表示されてしまいます。
['5', '位', 'アダルトのため規制(タイトルが表示されてます)']
['20,408click']
['6', '位', 'アダルトのため規制(タイトルが表示されてます)']
['25,900click']
['7', '位', 'アダルトのため規制(タイトルが表示されてます)']
['8', '位', 'アダルトのため規制(タイトルが表示されてます)']
clickCntが10000以下のものは、clickCntは表示されませんが、タイトルはでています。
どうしたら、
['5', '位', 'アダルトのため規制(タイトルが表示されてます)']
['20,408click']
['6', '位', 'アダルトのため規制(タイトルが表示されてます)']
['25,900click']
で止めることができるのでしょうか?
ソースコードです↓
# <div>タグのclassが'itemTitle'または'clickCnt'の要素をすべて取得
div_itemTitle_tags = soup.find_all('div', class_=lambda x: x in ['itemTitle', 'clickCnt'])
# iconGoodSiteクラスを持つ要素を削除します。
for div_item in div_itemTitle_tags:
for iconGoodSite_tag in div_item.find_all(class_='iconGoodSite'):
iconGoodSite_tag.extract()
# 数値が10000以上の要素だけを表示
for div_item in div_itemTitle_tags:
text_list = [x for x in div_item.stripped_strings]
if 'clickCnt' in div_item.get('class', []):
# 'clickCnt'の要素内のテキストを取得し、カンマを削除してから数値に変換
click_count_text = text_list[0]
click_count = int(re.sub(r'[^\d]', '', click_count_text))
if click_count >= 10000:
# 10000以上の場合、itemTitleを表示
print(text_list)
elif 'itemTitle' in div_item.get('class', []):
# itemTitleを表示
print(text_list)
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- JavaScript javascript ループがうごかない 2 2021/10/25 16:19
- PHP アコーディオンPHPが上手くいかない 3 2022/07/15 16:29
- Perl RSSにdiv,ul classを付けたいのですがどのようにつけるのかわからないです 2 2022/03/28 01:53
- PHP 日付と年月日を選択するコードを書いているのですが、セレクトボックスの中に、「曜日」を表示させたいので 3 2021/12/10 09:20
- JavaScript 付属の写真のようにエラーが出るようにしたいです。 提示したコードだけでは、エラーメッセージ文字が上の 1 2021/11/23 08:27
- JavaScript javascriptとPHPで入力フォームのコードを書いているのですが、 流れとしては、①入力フォー 2 2021/12/02 09:18
- JavaScript JavascriptでDom XSSの脆弱性対策を行いたい 2 2023/09/24 21:20
- JavaScript ①入力フォーム→②確認表示画面→③送信完了画面のコードを書いているのです、 入力フォームから受け取っ 2 2022/05/10 16:45
- JavaScript 入力フォームの javascript で メールアドレスの正規チェックをを行い、ボタンをクリックして 2 2022/04/27 16:06
- JavaScript vertical sliderをautoplayしたい 2 2022/08/25 14:47
関連するカテゴリからQ&Aを探す
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
JUGEMのブログデザインについて
-
CGI.pmでかけないタグってあり...
-
Excel で下線が消えてしまうの...
-
リンク先のURLを別の文字にする...
-
URLが青くならない
-
パワーポイント:テキストボッ...
-
Google Keepで数字に勝手に下線...
-
AppleのNumbersというアプリで...
-
エクセルのセルの下線が消えない
-
HTMLのbody内に<style>~</styl...
-
AUTOCAD文字の下に同じ長さの線...
-
PivotTableのデータソースを一...
-
ニコ動のタグ荒らしについて
-
powerpointの下線
-
平方完成 平方完成についてです...
-
Wordでメルアド入力する際の下...
-
Wordでレイアウトを変えないで...
-
アンダースコア(下線)のあるメ...
-
Excelヘッダーの書式
-
Movabletype、エントリータグに...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Pythonのスクレイピングの質問...
-
どうしてもボタンが横一列に並...
-
C# htmlの一部の文字取得
-
cssで行の先頭にマークをつける...
-
同じ画像なのに同一ページで表...
-
リンク先のURLを別の文字にする...
-
Excel で下線が消えてしまうの...
-
URLが青くならない
-
パワーポイント:テキストボッ...
-
Google Keepで数字に勝手に下線...
-
HTMLのbody内に<style>~</styl...
-
アンダースコア(下線)のあるメ...
-
Latexにおける下線のひき方のコト
-
AppleのNumbersというアプリで...
-
フランス語の質問です。 J'aime...
-
Word で下線の色の変え方
-
エクセルのセルの下線が消えない
-
Wordでレイアウトを変えないで...
-
WORD2010 ハイパーリンクの下線...
-
Excelヘッダーの書式
おすすめ情報