不動産ジャパンのデータを解析してみよう1
中古物件の問題で記事書いたり、それ以外で考える日々が続きました。
そのうちで考えたものとして二束三文で買い叩かれている住宅です。
やっぱり、そういう物件が最も空き家になる可能性が高く感じたんですよ。
空き家の何が問題かって勿論放置したことによる事故とか怪我の危険性だけじゃなくてホームレスとか野良犬のすみかになることや、空き家がきっかけで家事になることとか、あとは景観的な問題がかわってくるところです。
海外の不動産がいいパフォーマンスで取引されていることの一つに、自分の住宅を資産として観ているというのがあります。そのために、自分の近隣に有る資産価値をさがる要因に対しては徹底抗戦しています。
日本でリクルートやライフルを始めとした企業や、国が中古住宅について問題視して色々対策を打って、円滑な販売モデルが確立するだろうなというのは思います。そこの要素の一つに地域そのもの要素も入ってくるのは間違いないわけです。
なので、景観やその他もろもろのプラスを下げる恐れのある空き家は無くすのが責務になります。
それで空き家になる物件って、実際にどういった共通点があるのかというのが気になって分析を行っていきたいと思います。場所とか築年数とか、そういった要因は確実にあるんでしょうけど、それ以外にどういったところがあるのかナマのデータで観てみたいのでやってみます。
大手企業は多分綺麗なデータベースをもって、ガリガリ分析やってるんだと思いますが、今現在存在していないので不動産ジャパンのデータをクロールして集めることにしました。(ごめんなさい)
今回集める対象とした物件は、中古物件で掲載されている価格が1000万以下のものを対象に情報を集めてみました。おそらく、この値段以下で出されているものは需要が低いものだと考えられるので、手始めにそこから調べてみようと思います。
Pythonで指定価格以下の中古物件を不動産ジャパンからクロールするスクリプトを作成しました。
之を使って1000万以下の物件を抽出して、テキストに吐き出しました。
こんな感じで出力しました。
次回以降で、このURL先の物件のページからデータを抽出し処理しやすいように整形して、きれいになったやつをDBに書き込んで、どういった共通点があるのか調べてみたいと思います。