【速いおっちゃんリストを作ってみた】
2020、2019、2018年度のランナーズの年代別マラソンランキングを利用して
3年間連続して100位以内を実現しているおっちゃんをリストしてみた。
私がやった方法はこんな感じ
【1】スマホのアプリ”keepメモ”を使って、
ランナーズの年代別マラソンランキング
の1ページを写真に撮る。
【2】”画像のテキストを抽出”で、写真からデータを抽出する。
【3】抽出したデータをメールでパソコンに送り、
エディタで数字、大会名など不要なデータを置換して取り除き、
氏名のリストを作る。
【4】Excelなどに年度毎に貼り付け、countif関数を使って
その人のデータが何個存在するかを数える
すると、3年連続で年代別100以内に入っている149名もの人がリストされました。
名前をざっと見て、速い先輩3名も存在することを確認し、
簡単レベルですが、ある程度の信頼性はありそうです。
頭から10名程の方の名前をfacebookで検索したが
うまく引っかからない。
私より世代が上なので、facebookをやられてないのかもしれない。
それより何より、私としてはデータを抽出する過程が楽しくて、
今のところそれで満足しているところはあります。
だって、それぞれのステップで私の感想を入れてみると
【1】スマホのアプリ” keepメモ “を使って、
ランナーズの年代別マラソンランキング
の1ページを写真に撮る。
1ページを一枚の写真に撮るのよ。
1ページに400名もの名前が載っています。
【2】”画像のテキストを抽出”で、写真からデータを抽出する。
こんなちびっこい写真のデータをホンマに抽出してくれるのです。
すごいよ。 私はまずこれに感心した。
【3】抽出したデータをメールでパソコンに送り、
エディタで数字、大会名など不要なデータを置換して取り除き、
氏名のリストを作る。
これは元データが
氏名、タイム、陸連登録県名、大会名
になっているので、データを氏名だけにするために
数字や、:や、県名、大会名、などを置換で変換し
年度毎に氏名だけの一覧を作った。
【4】Excelなどに年度毎に貼り付け、countif関数を使って
その人のデータが何個存在するかを数える
2020年度の記録が一番少ないので
2020年度の記録を基準として
2019年度、2018年度に氏名があるかどうかをExcelの関数に探させて、
3年連続で氏名が存在する方々のリストを作成した。
私の脳みそが
思いついたらやってみたい。やらないと収まらない
タイプのようで、とりあえず燃え盛っている間に可能な範囲でやってみました。
keepメモ の優秀さは理解しましたが
いかんせんほんまもんのスキャナーには負ける。
テキスト抽出した結果の並びが毎回異なり、うまく処理できなかったり、
姓と名が分割されてしまう人がいたり、
光ってたりして判読できず”?”に変換されているものも多く
厳密にやれば、3年連続で名前が載っている人はもっと多いと思われます。
(だって、わざわざ大会のごく少ない2020年に高い金を払って川っぺりのマラソンを走る方々だもの)
私としては
速いおっちゃんリストが作れることはわかった。
で満足し、
facebookでちょろっと検索したが対応する人がいない。
でやる気が無くなって、このまま放置に向かいそうですが、
素晴らしい活用アイディアが閃いてしまった、という方は
このやり方をパクって試してみてください。
【1】、【2】で普通のスキャナを使えば確実に精度は上がると思います。
何やってんだか。
いや、色々経験を積むことは大切よね。
今日の大泉カインドで話を転がして、化けそうか確認しますw
ブログランキングに参加しています。
氣前よくポチッとクリックよろしくお願いします。
にほんブログ村
いつもありがとうございます。