Twitterでよく使った漢字100個を自分で調べてみました

Twitterで最近人気なのが、「今年1年で最もよく利用した漢字」を調べてくれるこのサービス。

郵便年賀|ゆうびん.jp
過去のツイートを取得して分析するので、ランダムで結果が出る「診断なんちゃら」とは違い、実際の内容に則した結果になりますから利用者が多いですね。また演出も凝っていてとても面白いです。


使ってみるとこんな感じでした。

まずTwitterOAuth認証を行い、このサービスに自分のツイートを取得する許可を与えます。その後、取得されていきます。ここは結構時間がかかりますね、場合によっては数分かかるかもしれません。このサービスのせいではなく、主にTwitter側の処理の問題なので気長に待ちましょう。



取得が終わると、分析をするのでしょうか?ウサギのキャラが墨をすっています。



分析を終えると、ツイートする時間帯から性格診断みたいなこともしてくれます、

こうした統計も取ってくれますね。2332回だそうです。


で、それじゃあ最も多く使った漢字は?とボタンを押すと、寅の先生が「カッ!」と眼を見開き、

かっこよく描いてくれます。

私の結果はこんな感じになりましたね

この内容を、Twitterに投稿したりまたは年賀状にも使えるテンプレートなんかもダウンロードができるみたいで、かなりよく出来ているサービスです。




……とは言え、実は私は今年2010年1月1日〜11月1日までに5829件投稿しているんですよね。Twitterの仕様上仕方ないんですが、こうしたサービスでは全件は取得できず統計としても中途半端なものになってしまいます。なので、実際にはどの漢字をつかっていたのか?自分で調べてみました。


過去の投稿を遡って取得するというのは結構メンドイものの、
screenshot
Twilog - Twitterのつぶやきをブログ形式で保存
こちらのサービスに登録しておくと、毎日の投稿を記録してくれるので大変便利です。登録期間のログを一括でダウンロードできる他、Twitter公式よりもはるかに便利に検索できたり、日付ごとに投稿が投稿が見れたり、投稿数の推移など統計・分析ができたりと、非常に便利なのでみんな使えばいいと思う。



で、私は以前からこのサービスを利用しているので、過去ログをダウンロードしました。

統計結果

調査対象は、今年2010年1月1日〜11月1日までの5829件。もちろん公式RTは除外。

回数 漢字
1 1558
2 1079
3 986
4 838
5 796
6 794
7 692
8 661
9 660
10 628 使

とりあえず、上位10件まで。
「日」は元々ほかのユーザーでも使用頻度が高い漢字なんですが、それに加えて私が毎日ドット絵でプロフィール画像を変更しているのと、その画像の内容を説明しているためでしょう。

こんな感じの説明文を、毎日行っています。そのため「変」「更」「中」もランクイン。
「分」は「分かる」を使うため、または「自分」、「思」は「○○だと思う」といった言い回しをよく使用するためでしょう。「人」「見」「使」は日常よく使う言葉ですし、「方」は「高齢の方(かた)」「あっちの方(ほう)」など利用頻度が高いです。この辺りは文体の特徴が出ますね。


以下、11位以降

回数 漢字
11 618
12 591
13 583
14 578
15 571
16 533
17 518
18 509
19 505
20 498
21 492
22 490
23 482
24 470
25 462
26 458
27 454
28 452
29 446
30 444
31 436
436
33 412
412
35 402
36 386
37 385
38 381
39 377
40 374
41 371
42 369
43 366
44 351
45 350
46 344
47 342 稿
48 341
49 340
50 334
51 332
52 328
53 324
54 322
55 320
56 317
57 311
58 307
59 298
60 297
61 296
62 294
294
294
65 289
66 286
67 284
68 280
69 279
70 275
71 273
72 270
73 267
74 262
75 259
76 257
77 256
256
256
80 251
251
82 250
83 249
84 247
247
247
247
88 246
89 244
90 239
91 237
92 236
93 234
234
95 233
96 230
97 226
98 221
99 220
220

まぁこんな感じですね。
私は非公式RTはしないものの、リンク紹介やはてなブックマーク連動でサイト名を含まれることがあるので、きちんと除外するともう少し精度が高かったかもしれませんが、面倒なのでそのまま。
100位以降も見返してみると、文章の特徴などが出ていて納得したり、もう少し表現の幅を広げないといけないなーと、反省したり。

><