Twitterでよく使った漢字100個を自分で調べてみました
Twitterで最近人気なのが、「今年1年で最もよく利用した漢字」を調べてくれるこのサービス。
郵便年賀|ゆうびん.jp
過去のツイートを取得して分析するので、ランダムで結果が出る「診断なんちゃら」とは違い、実際の内容に則した結果になりますから利用者が多いですね。また演出も凝っていてとても面白いです。
使ってみるとこんな感じでした。
まずTwitterでOAuth認証を行い、このサービスに自分のツイートを取得する許可を与えます。その後、取得されていきます。ここは結構時間がかかりますね、場合によっては数分かかるかもしれません。このサービスのせいではなく、主にTwitter側の処理の問題なので気長に待ちましょう。
取得が終わると、分析をするのでしょうか?ウサギのキャラが墨をすっています。
分析を終えると、ツイートする時間帯から性格診断みたいなこともしてくれます、
こうした統計も取ってくれますね。2332回だそうです。
で、それじゃあ最も多く使った漢字は?とボタンを押すと、寅の先生が「カッ!」と眼を見開き、
かっこよく描いてくれます。
私の結果はこんな感じになりましたね
この内容を、Twitterに投稿したりまたは年賀状にも使えるテンプレートなんかもダウンロードができるみたいで、かなりよく出来ているサービスです。
……とは言え、実は私は今年2010年1月1日〜11月1日までに5829件投稿しているんですよね。Twitterの仕様上仕方ないんですが、こうしたサービスでは全件は取得できず統計としても中途半端なものになってしまいます。なので、実際にはどの漢字をつかっていたのか?自分で調べてみました。
過去の投稿を遡って取得するというのは結構メンドイものの、
Twilog - Twitterのつぶやきをブログ形式で保存
こちらのサービスに登録しておくと、毎日の投稿を記録してくれるので大変便利です。登録期間のログを一括でダウンロードできる他、Twitter公式よりもはるかに便利に検索できたり、日付ごとに投稿が投稿が見れたり、投稿数の推移など統計・分析ができたりと、非常に便利なのでみんな使えばいいと思う。
で、私は以前からこのサービスを利用しているので、過去ログをダウンロードしました。
統計結果
調査対象は、今年2010年1月1日〜11月1日までの5829件。もちろん公式RTは除外。
回数 | 漢字 | |
---|---|---|
1 | 1558 | 日 |
2 | 1079 | 人 |
3 | 986 | 分 |
4 | 838 | 思 |
5 | 796 | 変 |
6 | 794 | 方 |
7 | 692 | 見 |
8 | 661 | 更 |
9 | 660 | 中 |
10 | 628 | 使 |
とりあえず、上位10件まで。
「日」は元々ほかのユーザーでも使用頻度が高い漢字なんですが、それに加えて私が毎日ドット絵でプロフィール画像を変更しているのと、その画像の内容を説明しているためでしょう。
「分」は「分かる」を使うため、または「自分」、「思」は「○○だと思う」といった言い回しをよく使用するためでしょう。「人」「見」「使」は日常よく使う言葉ですし、「方」は「高齢の方(かた)」「あっちの方(ほう)」など利用頻度が高いです。この辺りは文体の特徴が出ますね。
以下、11位以降
回数 | 漢字 | |
---|---|---|
11 | 618 | 自 |
12 | 591 | 表 |
13 | 583 | 一 |
14 | 578 | 今 |
15 | 571 | 目 |
16 | 533 | 言 |
17 | 518 | 手 |
18 | 509 | 新 |
19 | 505 | 大 |
20 | 498 | 私 |
21 | 492 | 気 |
22 | 490 | 的 |
23 | 482 | 示 |
24 | 470 | 年 |
25 | 462 | 書 |
26 | 458 | 出 |
27 | 454 | 作 |
28 | 452 | 画 |
29 | 446 | 描 |
30 | 444 | 前 |
31 | 436 | 時 |
436 | 合 | |
33 | 412 | 毎 |
412 | 本 | |
35 | 402 | 公 |
36 | 386 | 間 |
37 | 385 | 生 |
38 | 381 | 数 |
39 | 377 | 用 |
40 | 374 | 無 |
41 | 371 | 投 |
42 | 369 | 回 |
43 | 366 | 面 |
44 | 351 | 上 |
45 | 350 | 感 |
46 | 344 | 場 |
47 | 342 | 稿 |
48 | 341 | 定 |
49 | 340 | 式 |
50 | 334 | 以 |
51 | 332 | 度 |
52 | 328 | 者 |
53 | 324 | 意 |
54 | 322 | 能 |
55 | 320 | 多 |
56 | 317 | 子 |
57 | 311 | 動 |
58 | 307 | 最 |
59 | 298 | 事 |
60 | 297 | 記 |
61 | 296 | 行 |
62 | 294 | 倍 |
294 | 小 | |
294 | 月 | |
65 | 289 | 機 |
66 | 286 | 確 |
67 | 284 | 話 |
68 | 280 | 後 |
69 | 279 | 色 |
70 | 275 | 入 |
71 | 273 | 初 |
72 | 270 | 難 |
73 | 267 | 名 |
74 | 262 | 発 |
75 | 259 | 実 |
76 | 257 | 当 |
77 | 256 | 理 |
256 | 報 | |
256 | 地 | |
80 | 251 | 利 |
251 | 現 | |
82 | 250 | 説 |
83 | 249 | 読 |
84 | 247 | 明 |
247 | 知 | |
247 | 体 | |
247 | 何 | |
88 | 246 | 違 |
89 | 244 | 考 |
90 | 239 | 像 |
91 | 237 | 情 |
92 | 236 | 不 |
93 | 234 | 題 |
234 | 全 | |
95 | 233 | 外 |
96 | 230 | 同 |
97 | 226 | 通 |
98 | 221 | 特 |
99 | 220 | 開 |
220 | 々 |
まぁこんな感じですね。
私は非公式RTはしないものの、リンク紹介やはてなブックマーク連動でサイト名を含まれることがあるので、きちんと除外するともう少し精度が高かったかもしれませんが、面倒なのでそのまま。
100位以降も見返してみると、文章の特徴などが出ていて納得したり、もう少し表現の幅を広げないといけないなーと、反省したり。
><