/*Google AdSense自動広告*/

2018年12月25日火曜日

Alteryx Designerで住所・人口密度などのポリゴンと緯度経度ポイントデータを「Spacial Match」でマッチング

最近仕事で「Alteryx Designer」というアプリを使い始めたので、これから私が組んだ実例を紹介しようと思います。何しろ日本語での情報が少なすぎるので、同じアプリを使う人のお役に立てればと。質問・アドバイスはコメント・問い合わせフォームから受付けておりますが、回答は私の知っている限りで、期限を設けられないことをご了承ください。

今回は、Alteryx Designerの特長でもある、空間データのマッチングを利用した、「A地点はXというポリゴン(範囲内)に属する」一覧レポートを出力するワークフローの紹介です。緯度経度一覧に、住所や夜間人口を追記したい時に活用できるのでは?

ワークフローの概要

  • PowerShellスクリプトを実行し、ポイント名・緯度経度のCSVデータを取得する
  • 緯度経度から地図上の地点作成
  • 既存のポリゴンデータとマッチング
  • 必要な項目をセレクトする
  • CSVファイルを出力する





Alteryx Designerとは?目的・ExcelやAccessとの違い

Alteryx Designerとは、GUIでデータ解析用プログラムの作成・実行を行うツールです。データ解析はMicrosoft ExcelやAccessでも可能ですが、VBAでのコーディングが必要となる場面も出てきます。またAlteryxで扱えるファイル形式は、Excel(xlsx、以下カッコ内は拡張子)、Access(accdb)はもちろん、MapInfoのポリゴン(tab)やGoogle Earth KML(kml)等の空間データも網羅しているので、より多くの連携処理が可能です。

VLOOKUPで処理するくらいならExcelでもOKですが、緯度と経度のデータを使って距離や面積などを算出するならばAlteryxの方が高速です。ただし、年間5,000ドル強と高額なので、個人が購入するアプリではありませんね。

GUIでツールをワーク画面に放り込んで、線でつないげば完成という触れ込みですが、実際はCUIでIF文を書いたり、SQLの知識が必要になったりで、ホームページの「非エンジニアもデータ解析ができる」は眉唾です。

Run Command(Developerツール)

コマンドラインでプログラムを実行するツールです。今回はPowerShellスクリプトで緯度経度CSVを作成しますが、既にファイルがある場合は後述のInput Dataを使います。

PowerShellのps1ファイルの実行は、以下の設定で。Output/Inputは不要なのですが、どちらかを埋めないとエラーが出る仕様なので、PowerShellが吐き出すCSVファイルを記入しました。


  • Command : powershell
  • Command Arguments : & ".\get_points.ps1"
  • Output/Input : どちらかに使用するファイルを指定


Create Points(Spacialツール)

緯度経度を記載したデータは、そのままだと空間データとして使用できません。「この項目を緯度、これを経度として認識しなさい」と指定するのがCreate Pointsツールです。X Field (Longitude)に項目「経度」や「Longitude」を選択します。小数形式で記入します(緯度経度全般に言えることですが、使うデータ全て世界地図系の小数形式で揃えることをおすすめします。度分秒は使い辛い!)。

Input Data(In/Outツール)

既存ファイルはInput Dataで開きます。もしダイアログで都度指定したい場合は、InterfaceツールのFile Browseを使用します。File FormatとCode Pageを正しく指定しないと、データがうまく読み込めない可能性があります。

Spacial Match(Spacialツール)

Tに地点データ、Uにポリゴンデータを入力し、Mからマッチしたデータを出力します。

TargetはCentroid(重心)を、UniverseはSpatialObj(空間データ)を指定し、「Where Target Within Universe」でポイントがどのポリゴンに属するかを算出できます。Targetは今回ポイント(点)のデータなので、重心=その地点となりますが。空間データの方にあらかじめ「住所」「人口密度」などの使用する項目を入力しておきます。例えば日本地図ポリゴンがあるとしたら、「県」「市区町村」「大字」等をポリゴンのデータ内に格納して利用します。

Select(Preparationツール)

必要な項目の選択・並び替え・既存項目のリネームができます。前述のSpacial Matchの中でも可能ですが、処理を可視できるように分けました。計算式やフィルタが必要な場合は、Formula、Filterを使用します。

Output Data(In/Outツール)

AlteryxはExcelファイルやCSVの他、空間データとしても結果を出力できます。今回はCSVで出力しました。どのポイントどのポリゴンに属するかを一覧で見ることができます。処理速度は2万件のポイントデータと20個のポリゴンを使用して1分以内。他のアプリと比べても高速です。

0 件のコメント:

コメントを投稿