Python プログラミング

【Python】ヤマト運輸の荷物追跡

みなさん、こんにちは。いし(@ishilog2)です。

今回はPythonを用いて、ヤマト運輸から荷物状況をスクレイピングにて取得したいと思います。

導入編

今回のコードではrequestsとBeautifulSoup、Pandasを使用します。
インストールしていない方はインストールして下さい。

実施すること

ヤマトの追跡サイトから画像の黄枠内の情報を取得します。

サンプルコード

xxxxxxxxxxxxには追跡番号を入れてください。

結果

解説

① requestsを用いてHTMLを取得
requests.get('URL')でHTML情報を習得します。
”number00”:1の部分は○件目です。今回のサンプルは1件しか取得しないので1で固定しています。

② BeautifulSoupを使用してhtml形式にパース
①で習得したHTMLからBeautifulSoupオブジェクトを作成します。

③ meisaiクラスの文字列を取得
④ 取得した内容をリストに格納
リスト内表記を使用して、習得したデータをリストに格納・リスト内の要素の前後にある空白を削除します。splitlines()で改行コードで分割しています。

⑤ リストを分割
先頭の3個を削除して8個ずつに分割しています。

⑥ リストをデータフレームへ変換
pd.DataFrame()でリストからデータフレームへ変換します。
リスト1つ目はヘッダーのため2つ目からをデータフレームにしています。カラムにはリスト1つ目を設定します。

-Python, プログラミング
-, ,

© 2021 IshiLog.com Powered by AFFINGER5