2009年9月18日金曜日

続・FONスポットのデータを調べてみた

関連記事ページへ
(直リンクしてるとわからないかもしれないので関連記事へのリンク追記 2009/9/22)
郵便番号7桁でマッチングしたランキング日本地図にマッピングしてみた

2009/9/24 フォロー追加
Google Analyticsのレポートによると、どうやら最初に字しか書いていないので離脱率(多分読まないで速攻帰る?)がこの記事が高いようなのでフォロー追加です。
結果だけ知りたい方は前半の文字を飛ばして見ていただければ、後半に市区町村別ランキング(TOP100)都道府県別ランキングが載っております。

前回は、単純にデータをマッチングさせてデータを作りましたが、単純に処理するとかなり無駄(マッチングできない)データがあり精度が悪いことが判ったので、少し高度に処理を施して精度を上げて集計をしてみようということで都道府県別、市区町村別のデータを作成してみました。
・・・っと単純にさくっと作る予定が・・・いやぁ・・・なんといいますか色んな形式の郵便番号の書き方があるというか、解釈ができるというか・・・凝り性な性格が災いしてといいますか、こんなに時間かけるとは思わなかったぉ・・・
一応例を挙げると
『123-4567』、『1234567』この2種類の形式が標準ですね
『123-45』、『12345』旧番号ですけどこれも標準ですね
問題児の一例
『123-4』多分『123-0004』なんだと思うけど郵便番号はゼロサプレスしちゃだめかと・・・
同様に『12-3』とかも同様にありましたが、一応『123-4』は『123-4000』という解釈もできそうですが郵便番号一覧など照合すると、調べる番号は大概前のほうに0を埋めるほうが正しい結果になるっぽいので今回はそういう風に処理しました。
後『-』が全角文字つかってるぽく化けてるとか、前後数字を個別抽出して変換しました。
漢字ついでの話ですけど、結構FONマップ(FON Maps)みてると登録住所の漢字が化けてますよね。ブラウザ上の入力はSJISとかUnicodeとかEUCコード混在するから結構化けて大変ですよね。Webアプリは大変だよね・・・
あと個人情報なのでデータを途中から『*』とか『X』とかで埋めてるとか、この辺は『0』に変換して大体上3桁あってれば市区町村は絞れるのでそのような処理をおこなっております。
※因みにテキスト処理は久しぶりにawkを使って処理をしてます(CSVとか処理しやすいからね・・・)
郵便番号データは郵便事業株式会社(日本郵便グループ)の提供しているデータを利用しました。
利用データは全国データと念のため事業所データをマージしてマッチングしてます。
因みに全データになると、6万件を軽く超えるので当初考えていたExcelでのデータ処理を断念して、Accessにデータをインポートして処理をおこないました(全国住所のデータが12万件、事業所データが2万件で全部で14万件ほどになります)
単純に番号比較で引けばいいかなと思って処理すると3000件近くマッチングできないデータがあり調べると、5桁・3桁で比較して確定できるとように処理しようとしたところ。結構郵便番号の住所への照し合せて奥が深くて、上3桁でマッチングしても、市区町村が複数登録されていたり都道府県自体またがってたりと・・・かなり(勉強にはなりましたが)苦労させられます。
(無駄に)高度なデータ処理が必要というかSQL文で処理をしていると、Accessの限界にたどり着いたため(FULL JOINできない・・・)にデータベースをSQL Serverに移行して処理するというなんて手間のかかることを始めてしまったのでしょうと後悔しつつ、やっと納得のいくデータが取れたので公開します。(前振りながっ
  • 市区町村別ランキング(TOP100)
順位
都道府県名
市区町村名
件数
1
東京都
世田谷区
1457
2
東京都
練馬区
911
3
東京都
杉並区
893
4
東京都
港区
890
5
東京都
渋谷区
877
6
東京都
新宿区
871
7
東京都
大田区
860
8
東京都
江東区
804
9
東京都
品川区
677
10
東京都
江戸川区
647
11
東京都
中野区
633
12
東京都
板橋区
604
13
東京都
目黒区
551
14
東京都
文京区
540
15
東京都
豊島区
538
16
東京都
足立区
502
17
千葉県
船橋市
500
18
千葉県
市川市
492
19
神奈川県
相模原市
475
20
東京都
八王子市
453
21
東京都
千代田区
438
22
東京都
台東区
428
23
東京都
中央区
425
24
東京都
北区
413
25
東京都
町田市
407
26
神奈川県
横浜市港北区
405
27
東京都
葛飾区
395
28
神奈川県
川崎市中原区
382
29
神奈川県
横浜市青葉区
374
30
埼玉県
川口市
366
31
千葉県
松戸市
352
32
東京都
墨田区
348
33
神奈川県
藤沢市
338
34
神奈川県
川崎市多摩区
308
35
神奈川県
川崎市高津区
297
35
東京都
調布市
297
37
東京都
三鷹市
288
38
東京都
府中市
268
39
福岡県
福岡市中央区
267
40
茨城県
つくば市
258
41
千葉県
柏市
248
41
東京都
荒川区
248
43
神奈川県
横浜市神奈川区
241
44
神奈川県
川崎市宮前区
232
45
神奈川県
横浜市鶴見区
228
46
千葉県
浦安市
227
47
神奈川県
横浜市都筑区
225
47
神奈川県
横浜市戸塚区
225
49
長崎県
南島原市
218
50
北海道
札幌市中央区
213
51
東京都
武蔵野市
212
52
東京都
西東京市
210
53
神奈川県
横浜市保土ケ谷区
207
54
兵庫県
西宮市
206
55
大阪府
吹田市
202
56
神奈川県
川崎市麻生区
198
57
神奈川県
川崎市川崎区
190
58
熊本県
熊本市
189
58
大阪府
豊中市
189
60
神奈川県
横須賀市
188
61
東京都
小平市
183
62
神奈川県
大和市
178
62
神奈川県
鎌倉市
178
64
大阪府
大阪市北区
176
65
福岡県
福岡市東区
175
66
兵庫県
尼崎市
174
67
埼玉県
越谷市
173
68
神奈川県
横浜市中区
172
69
神奈川県
横浜市緑区
171
70
北海道
札幌市北区
167
71
埼玉県
さいたま市南区
166
72
埼玉県
草加市
163
73
東京都
多摩市
161
74
千葉県
流山市
160
74
栃木県
宇都宮市
160
76
大阪府
大阪市中央区
159
77
大阪府
東大阪市
158
77
大阪府
枚方市
158
79
福岡県
福岡市博多区
157
80
神奈川県
厚木市
156
81
愛知県
名古屋市千種区
155
82
神奈川県
横浜市金沢区
148
83
愛知県
豊田市
147
83
神奈川県
横浜市南区
147
85
神奈川県
横浜市旭区
146
86
京都府
京都市左京区
142
86
東京都
小金井市
142
88
神奈川県
川崎市幸区
141
88
大阪府
大阪市淀川区
141
88
千葉県
千葉市美浜区
141
91
宮城県
仙台市青葉区
138
92
愛知県
名古屋市中区
137
92
東京都
立川市
137
94
神奈川県
横浜市西区
136
94
埼玉県
所沢市
136
94
石川県
金沢市
136
97
奈良県
奈良市
135
97
東京都
国分寺市
135
97
神奈川県
茅ヶ崎市
135
100
北海道
札幌市豊平区
134
100
千葉県
千葉市中央区
134

このデータは、『FONを利用しやすい都市ランキング』(?)といっていいのでしょうか、しかしちょっ・・・この世田谷区の1457ヶ所ってこのダントツの数字はなんでそ・・・気になって世田谷区について調査をしてみると面積的にも大きく住宅地だし大学とかも多いし学生さんとかが多いのかな?と雰囲気的にはそんな感じなのかなと思いますが何かFONコミュニティでもあるのでしょうか。

追記:データが多いのでブログ本体には貼り付けていない、100位以降を含むデータはこちらです。
利用価値はないかもしれませんが、2次利用自体制限はかけませんが(もともとネットから拾ってるデータを集計してるだけなので)改竄したり問題が起こりそうな利用はおやめください。(問題を把握できるように出所は明示してください)
※Google Docsは初めて利用するので、何か設定など間違ってたら指摘してください。
  • 都道府県別ランキング
順位
都道府県名
件数
割合
1
東京都
19385
31.66%
2
神奈川県
7539
12.31%
3
大阪府
3890
6.35%
4
埼玉県
3770
6.16%
5
千葉県
3744
6.12%
6
愛知県
3156
5.15%
7
北海道
1867
3.05%
8
福岡県
1802
2.94%
9
兵庫県
1709
2.79%
10
静岡県
1060
1.73%
11
京都府
1041
1.70%
12
茨城県
946
1.55%
13
広島県
717
1.17%
14
長野県
625
1.02%
15
岐阜県
583
0.95%
16
宮城県
549
0.90%
17
長崎県
488
0.80%
18
栃木県
447
0.73%
19
群馬県
438
0.72%
20
新潟県
434
0.71%
21
三重県
399
0.65%
22
奈良県
387
0.63%
23
岡山県
382
0.62%
24
福島県
371
0.61%
25
山形県
359
0.59%
26
滋賀県
348
0.57%
27
沖縄県
330
0.54%
28
熊本県
315
0.51%
29
石川県
311
0.51%
30
鹿児島県
295
0.48%
31
山口県
270
0.44%
32
愛媛県
243
0.40%
33
岩手県
237
0.39%
34
山梨県
224
0.37%
35
香川県
221
0.36%
36
富山県
214
0.35%
37
大分県
211
0.34%
38
和歌山県
195
0.32%
38
青森県
195
0.32%
40
福井県
174
0.28%
41
秋田県
160
0.26%
42
徳島県
157
0.26%
43
佐賀県
155
0.25%
43
宮崎県
155
0.25%
45
島根県
124
0.20%
46
鳥取県
112
0.18%
47
高知県
90
0.15%

分類不可
400
0.65%
 データについての補足事項
  • 全体件数は61224ヶ所、『000-0000』に変換された規定外文字を含むデータ340ヶ所、変換しきれなかった郵便番号(3桁に絞り込んでも複数県またがる)を含むデータ60ヶ所
  • 登録済みスポットが全て有効ではなく、実稼働していない(生起確認が取れない)LaFoneraも多数あるからかなりの数間引いて判断しないといけないと思いますが、実際に稼働していないのではなくてファイヤウォールなどで生起確認できないものもあるんじゃないかとは思います。大量投入されている世田谷区の利用者さんの生の声を聞いてみたいところです。

上位10位ぐらいまでで全体の8割ぐらいです。
もしかすると都市部しかないという構造であるとすると、ちょっとした通信キャリア並?w

地方のFONスポットが増えるためにはどういうことが必要でしょう。
何点か案を考えてみました。
  • パーキングエリアとか道の駅、街道沿いちょっとした売店みたいなとこに、FON Mapsで探してくるお客さんを集めるために設置するように店主に助言する(唆す)
高速道路¥1000円の影響もあるし長時間高速道路をおりないので、利用できればネット依存度の高いユーザ向けに需要があるのではないかと思う、また財布の紐が固いユーザでも自販機の一つでもあればついでに利用するのではないかという思惑w
電話回線はあることを前提に考えて、ADSLとか最安値のプランで構わないので月々約¥2000円程度として利用者サービスとしては有効じゃないかと、難点としては既にフリースポットがこのジャンルを開拓している点と電話収容局からの距離。
モバイルPCの活動限界なども考慮して給電スタンド(30分とか1時間¥100円ぐらい?)を完備すると尚グッドかも。
チェーン店とかだとPOSシステムのようなネット接続もついでにするとか、Skypeなどで電話連絡など無料通話が可能などのメリットを訴求する。
道の駅などはADSLが繋がるか微妙な気もしますが、地方のほうがADSL収容局が近い場合もあるので有効な可能性もあると思います。
追記:微妙に素直にフリースポットとして運営したほうが良い気がしますがきっと気のせいです
  • Wiiをネットに有線接続してゲームにしか使ってない(条件がピンポイントw)友人に『FONを使うとDSやPSPもネットに繋げるよ』と助言する(唆す)、要出張設定
 『Wii×フレッツ光』キャンペーンなどでとりあえず、回線はあるがWiiしか使ってない(使えない)友人を探し出し『DSとかPSPも使えるよ』と教えてあげる(吹きこむ)
  • 『Wii×フレッツ光』の考えをぱくって、『PSP×○○○』でプロバイダにキャンペーンをしてもらう。
 例えば、プロバイダ契約などしてしまえばメールアドレスなども決まる場合が多いので、LaFONERAの登録自体など初期設定もして出荷すれば、無線ルータを無料で配布しているプロバイダキャンペーンも多いので広めるには有効ではないかと思われる。
LaFONERA接続により、自宅以外でも利用できる可能性もあることが伝われば稼働率も高くなりそうな予感。
※この案採用されないかなw
追記:既にlivedoorでやってるっぽいですけど、微妙に趣旨が違うので重要なのは契約と一緒に無線ルータもキャンペーンで配ってしまうという点です

後半はかなり暴走気味な提案ですが、要は地方でももっと利用できるスポットが増えるといいですねということです。
内容がかなりぶれている気がしますが、以上です。

      0 件のコメント:

      コメントを投稿