
Pythonのスクレイピングの質問です。
こちらのランキングサイトから
clickCntが10000以上のタイトルをもってこようとしてます。(clickが1万以上のもの)
R18サイトになります↓
https://movie.eroterest.net/popular/?days=1
実際にコードを書いたのですが、このように
clickCntが10000以下のタイトルを表示されてしまいます。
['5', '位', 'アダルトのため規制(タイトルが表示されてます)']
['20,408click']
['6', '位', 'アダルトのため規制(タイトルが表示されてます)']
['25,900click']
['7', '位', 'アダルトのため規制(タイトルが表示されてます)']
['8', '位', 'アダルトのため規制(タイトルが表示されてます)']
clickCntが10000以下のものは、clickCntは表示されませんが、タイトルはでています。
どうしたら、
['5', '位', 'アダルトのため規制(タイトルが表示されてます)']
['20,408click']
['6', '位', 'アダルトのため規制(タイトルが表示されてます)']
['25,900click']
で止めることができるのでしょうか?
ソースコードです↓
# <div>タグのclassが'itemTitle'または'clickCnt'の要素をすべて取得
div_itemTitle_tags = soup.find_all('div', class_=lambda x: x in ['itemTitle', 'clickCnt'])
# iconGoodSiteクラスを持つ要素を削除します。
for div_item in div_itemTitle_tags:
for iconGoodSite_tag in div_item.find_all(class_='iconGoodSite'):
iconGoodSite_tag.extract()
# 数値が10000以上の要素だけを表示
for div_item in div_itemTitle_tags:
text_list = [x for x in div_item.stripped_strings]
if 'clickCnt' in div_item.get('class', []):
# 'clickCnt'の要素内のテキストを取得し、カンマを削除してから数値に変換
click_count_text = text_list[0]
click_count = int(re.sub(r'[^\d]', '', click_count_text))
if click_count >= 10000:
# 10000以上の場合、itemTitleを表示
print(text_list)
elif 'itemTitle' in div_item.get('class', []):
# itemTitleを表示
print(text_list)
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- JavaScript javascript ループがうごかない 2 2021/10/25 16:19
- PHP アコーディオンPHPが上手くいかない 3 2022/07/15 16:29
- Perl RSSにdiv,ul classを付けたいのですがどのようにつけるのかわからないです 2 2022/03/28 01:53
- PHP 日付と年月日を選択するコードを書いているのですが、セレクトボックスの中に、「曜日」を表示させたいので 3 2021/12/10 09:20
- JavaScript 付属の写真のようにエラーが出るようにしたいです。 提示したコードだけでは、エラーメッセージ文字が上の 1 2021/11/23 08:27
- JavaScript javascriptとPHPで入力フォームのコードを書いているのですが、 流れとしては、①入力フォー 2 2021/12/02 09:18
- JavaScript JavascriptでDom XSSの脆弱性対策を行いたい 2 2023/09/24 21:20
- JavaScript ①入力フォーム→②確認表示画面→③送信完了画面のコードを書いているのです、 入力フォームから受け取っ 2 2022/05/10 16:45
- JavaScript 入力フォームの javascript で メールアドレスの正規チェックをを行い、ボタンをクリックして 2 2022/04/27 16:06
- JavaScript vertical sliderをautoplayしたい 2 2022/08/25 14:47
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
数学、プログラミング、物理、...
-
Python... 環境設定 初心者です...
-
画像生成AIのプロンプトの作り...
-
vba クリップボードクリアにつ...
-
CSVファイルの複数行削除
-
Google ColaboでGUI作成
-
pip --versionがエラーになる
-
パイソンのソースコードをChatG...
-
pythonの実行に関する質問
-
OS入ってる機器のソフト・アプ...
-
Python 3.12.2 か一番最新のパ...
-
⚠️至急です!⚠️ Yahoo!知恵袋の...
-
Pythonのエラーメッセージをコ...
-
AIの登場でプログラマーたちが...
-
PowerAutomateで運賃検索がした...
-
Pythonを使ってせん断応力図、...
-
プログラムについて。
-
VBSでテキストファイルの2行目...
-
VBAでパワーシェルを実行したい...
-
ExcelVBAでFormulaR1C1を列範囲...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Pythonのスクレイピングの質問...
-
アクセスカウンターで全ページ...
-
JUGEMのブログデザインについて
-
Excel で下線が消えてしまうの...
-
リンク先のURLを別の文字にする...
-
パワーポイント:テキストボッ...
-
URLが青くならない
-
Google Keepで数字に勝手に下線...
-
HTMLのbody内に<style>~</styl...
-
Word で下線の色の変え方
-
アンダースコア(下線)のあるメ...
-
アンダーラインを引くやり方
-
エクセルのセルの下線が消えない
-
Wordでレイアウトを変えないで...
-
ワードの表で下線と文字の入力
-
ExcelのVBAで下線のついている...
-
Excelヘッダーの書式
-
AUTOCAD文字の下に同じ長さの線...
-
AppleのNumbersというアプリで...
-
outlook2003にて新規メッセージ...
おすすめ情報