Pythonのスクレイピングの質問です。
こちらのランキングサイトから
clickCntが10000以上のタイトルをもってこようとしてます。(clickが1万以上のもの)
R18サイトになります↓
https://movie.eroterest.net/popular/?days=1
実際にコードを書いたのですが、このように
clickCntが10000以下のタイトルを表示されてしまいます。
['5', '位', 'アダルトのため規制(タイトルが表示されてます)']
['20,408click']
['6', '位', 'アダルトのため規制(タイトルが表示されてます)']
['25,900click']
['7', '位', 'アダルトのため規制(タイトルが表示されてます)']
['8', '位', 'アダルトのため規制(タイトルが表示されてます)']
clickCntが10000以下のものは、clickCntは表示されませんが、タイトルはでています。
どうしたら、
['5', '位', 'アダルトのため規制(タイトルが表示されてます)']
['20,408click']
['6', '位', 'アダルトのため規制(タイトルが表示されてます)']
['25,900click']
で止めることができるのでしょうか?
ソースコードです↓
# <div>タグのclassが'itemTitle'または'clickCnt'の要素をすべて取得
div_itemTitle_tags = soup.find_all('div', class_=lambda x: x in ['itemTitle', 'clickCnt'])
# iconGoodSiteクラスを持つ要素を削除します。
for div_item in div_itemTitle_tags:
for iconGoodSite_tag in div_item.find_all(class_='iconGoodSite'):
iconGoodSite_tag.extract()
# 数値が10000以上の要素だけを表示
for div_item in div_itemTitle_tags:
text_list = [x for x in div_item.stripped_strings]
if 'clickCnt' in div_item.get('class', []):
# 'clickCnt'の要素内のテキストを取得し、カンマを削除してから数値に変換
click_count_text = text_list[0]
click_count = int(re.sub(r'[^\d]', '', click_count_text))
if click_count >= 10000:
# 10000以上の場合、itemTitleを表示
print(text_list)
elif 'itemTitle' in div_item.get('class', []):
# itemTitleを表示
print(text_list)
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- JavaScript javascript ループがうごかない 2 2021/10/25 16:19
- PHP アコーディオンPHPが上手くいかない 3 2022/07/15 16:29
- Perl RSSにdiv,ul classを付けたいのですがどのようにつけるのかわからないです 2 2022/03/28 01:53
- PHP 日付と年月日を選択するコードを書いているのですが、セレクトボックスの中に、「曜日」を表示させたいので 3 2021/12/10 09:20
- JavaScript 付属の写真のようにエラーが出るようにしたいです。 提示したコードだけでは、エラーメッセージ文字が上の 1 2021/11/23 08:27
- JavaScript javascriptとPHPで入力フォームのコードを書いているのですが、 流れとしては、①入力フォー 2 2021/12/02 09:18
- JavaScript JavascriptでDom XSSの脆弱性対策を行いたい 2 2023/09/24 21:20
- JavaScript ①入力フォーム→②確認表示画面→③送信完了画面のコードを書いているのです、 入力フォームから受け取っ 2 2022/05/10 16:45
- JavaScript 入力フォームの javascript で メールアドレスの正規チェックをを行い、ボタンをクリックして 2 2022/04/27 16:06
- JavaScript vertical sliderをautoplayしたい 2 2022/08/25 14:47
このQ&Aを見た人はこんなQ&Aも見ています
-
プロが教える店舗&オフィスのセキュリティ対策術
中・小規模の店舗やオフィスのセキュリティセキュリティ対策について、プロにどう対策すべきか 何を注意すべきかを教えていただきました!
-
スコープ解決演算子を解読できるサイトを教えて!
その他(プログラミング・Web制作)
-
Javaって使いますか、もう古いですか?C++とどっちがいいですか?分析でC++使う授業ありましたけ
C言語・C++・C#
-
Python超入門者です、win pcにv3.1インストールして入力してたった3行のコマンドを入力s
その他(プログラミング・Web制作)
-
-
4
Fortran の定数表現について
その他(プログラミング・Web制作)
-
5
シェルスクリプトで最初にサブコマンド関数をいくつか定義して最後にメイン処理書くのってきしょくないです
その他(プログラミング・Web制作)
-
6
C言語 バッファについて。
C言語・C++・C#
-
7
テキストエディタvscodeでプログラミングしているのですが、 コメントアウトだけを折りたたむ、非表
その他(プログラミング・Web制作)
-
8
C言語などをマスターして、人生に何かメリットありますか???
その他(プログラミング・Web制作)
-
9
FTPサーバーについて
サーバー
-
10
サクラエディタ・マクロ → VSCode・マクロに変更
その他(プログラミング・Web制作)
-
11
SFTPなどは使わないホームページやプログラムファイルの公開方法
PHP
-
12
C言語について。
C言語・C++・C#
-
13
MS-DOS 6.22のダウンロード
その他(OS)
-
14
VB.Netでファイル圧縮する方法は何ですか?
Visual Basic(VBA)
-
15
Gitで空白のみの変更を削除したくてgit diff -wとコマンドで打ったのですが何も変わりません
その他(プログラミング・Web制作)
-
16
コマンドプロンプトについて。
C言語・C++・C#
-
17
python の素朴な疑問
その他(プログラミング・Web制作)
-
18
良いプログラム、悪いプログラムの条件
その他(プログラミング・Web制作)
-
19
なぜサーバーの運用にはLinuxが必要なのですか?
サーバー
-
20
JRのjsonファイルって使って大丈夫そ?
その他(プログラミング・Web制作)
関連するカテゴリからQ&Aを探す
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
プログラマーと学歴の関係性に...
-
プログラミングを教えたいです...
-
楽しくて最高のプログラミング...
-
小学1年生の子です。塾に行かせ...
-
vba クリップボードクリアにつ...
-
IT業界より楽に稼げる業界って...
-
ラズパイpico PIOモード
-
pythonで複数画像からgifを作る...
-
Pythonでgif画像が上手く作れない
-
プログラミング ソースコード
-
プログラミング
-
pythonにてseleniumを使うも、...
-
ものづくりに向いているプログ...
-
Google ColaboでGUI作成
-
JRのjsonファイルって使って大...
-
Webサイト内に埋め込んだmp4動...
-
そのまま使っただけなのに・・...
-
正規表現で複数マッチ条件で悩...
-
Pythonって何を意識した言語な...
-
スカラーのベクトル微分
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Pythonのスクレイピングの質問...
-
vb2019でHTMLの取得
-
リンク先のURLを別の文字にする...
-
Excel で下線が消えてしまうの...
-
パワーポイント:テキストボッ...
-
URLが青くならない
-
Google Keepで数字に勝手に下線...
-
エクセル:セル内の文字列の下...
-
AppleのNumbersというアプリで...
-
抗菌ウェットティッシュに発が...
-
アンダースコア(下線)のあるメ...
-
フランス語の質問です。 J'aime...
-
エクセルのセルの下線が消えない
-
Wordでレイアウトを変えないで...
-
ワードの表で下線と文字の入力
-
AUTOCAD文字の下に同じ長さの線...
-
HTMLのbody内に<style>~</styl...
-
PivotTableのデータソースを一...
-
outlook2003にて新規メッセージ...
-
【excelの下線(会計)とは】
おすすめ情報