2018年3月25日日曜日

[雑感] 古文書の残存率の見積もり方


「文書を数百年やそれ以上の長さで残すには」という話題を耳にしたのですが、
その際「ちなみに過去の文書はどれくらいの速さで消えていくのだろう」と気になりました。
古代史の本を読んでいると「それについては記録が残っていない」「そういう文書があったことは分かっているが、現存しない」という話をよく見かけます。

横軸を「今から何年前」、縦軸を「残存率」(=現代に残っている文章量/当時書かれた文章量)に取った両対数グラフを描くと、
おおまかにはベキ的に減衰していく気がします(紙、木簡、石版、などの媒体別の残存しやすさ、厳重保管されているか否か、などのパラメータはとりあえず無視)。
この傾きの値が分かれば、「この文書は何部コピーがばらまかれているので、○○年後までは残りそう」というようなことが見積もれそうです。

残存率をどうやって得るのかはちょっと骨が折れそうです。
たとえば「孫子」の書かれた約2500年前の文書の残存率を計算しようとすると、
分子と分母にあたる「当時書かれた文書のうち、現在に残っている文字数」と「当時書かれた文字数」を見積もらなくてはいけません。
後者は当時の人口などから見積もれそうですが、前者はどうするか。
「孫子」などの有名な文書だけでなく、遺跡から発掘された無名の文書の文字数も見積もることになるでしょう。

2018年1月29日月曜日

[雑感] 機械学習に手を出そうして別の所へ行く

ツイートしても良かったのですが、長くなったので
ブログの更新再開を兼ねてここに書くことにします。

ここ1週間、流行り物の機械学習を学ぼうかと思いましたが、
結局違うところに行ってしまいました。

流れはこんな感じ。

・機械学習の入門書を読む
・ネットで機械学習関連ライブラリの説明を読む
・Python の本を読む
・いまひとつやる気が起きない
・もうちょっと今の仕事に役立つもののほうがモチベーションが上がるはずと思う(横道に逸れ始める)
・アソシエーション分析に興味を持つ
・統計学がよく分からない
・統計学の基礎を学べる本を探している(現在進行形)

さらに、上記とは並行で

・機械学習をやるにせよ統計をやるにせよ、使うためのコーディング能力が足りていない気がする
・ただし、本を黙々と読んでコーディングするだけだと続かないだろうから、もう少しモチベーションが上がるものがないか
・競技プログラミングやオンラインジャッジに行き着く
・とりあえず AtCoder と Aizu Online Judge に登録する(いまここ)

という流れも。

どちらも、長続きするかは分かりません。
時々訪れる、ふらふらして色んなものを見て回る時期なのかもしれません。