【レンタル掲示板 teacup.のデータを救出する プロジェクト】
レンタル掲示板のteacup.が8月1日で終了する。
サッカー部の連絡、子ども達の日々感じたことが山のように詰まっている。
私がブログに転記しているが
やはり跡形もなくなくなってしまうのは忍びない
と、
なんとか残せないか
と、調査を開始した。
すると、救いの神はいて、こんな記事を発見(ありがとうございます)
レンタル掲示板 teacup.のデータを救出する
https://zenn.dev/oskgw_log/articles/4002472fca930f
北海道に行く前から知ってはいたが、
眼の前の北海道ツアーに氣を取られて
こちらには力が向かず、やっとこさ着手
日曜日まるまる使って
レンタル掲示板 teacup.のデータをテキストファイルとしてバックアップを取る
ことに成功しました。
掲示板で見ることができる一番昔のページの
2010年までのデータをテキストデータに落とすことができた。
簡単に書くと
【1】python という開発環境でプログラムを組み
【2】selenium というブラウザのテスト環境を使って
【3】レンタル掲示板 teacup.の URL を指定すると
【4】1ページずつテキストデータを抽出し
【5】最後にテキストファイルとして出力する
仕組み。
参考にしたホームページには
環境の設定は各自お願いします。
とサラッと書いているのですが、これが一番難しい。
【1】python という開発環境でプログラムを組み
【2】selenium というブラウザのテスト環境
を共に使ったことがない。
【2】に至っては初耳だ。
今どきgoogle先生があるから、教えを請いつつ
亀のように進んで、動いたぜ、と思ったが
掲示板のデータ量が多すぎるので
【5】で
一つのファイルには収まらない
なので、プログラムを修正して、
100ページで一回テキストファイルを出力するようにした。
昨日眠りながら、
ラストの100ページに達していない分が保存できていないことに氣付き
今朝直して、動きを確認したりして、
まだ、完成には至っていません。
けど
teacup掲示板のデータを救いたい人はいるんじゃないかな
これを皆に 自分でせえ、と言うのは難しい
これをサービスとして提供できないかな
と考えて
掲示板のURL、連絡先を教えてもらって
可能な範囲でテキストデータのみを出力し、テキストファイルを返送する。
(データ量が大きくなる可能性があるので写真は対象にしない)
お礼は氣持ち分を 雅峰園のはちみつ でいただく
ハニーアクション一つとか
https://www.gahouen.com/SHOP/g19257/t01/list2.html
などと、夢見ていました。
レンタル掲示板 teacup.のデータを救出したい、バックアップを取りたい
と考えてる人はいらっしゃいますか。
サービスが必要な方は下記のコメントから連絡をください。
折り返し連絡します。 よろしくお願いします。
環境が変わったのか、現在エラーが出て上手く動かないので、サービスの提供は停止しています。
よろしくお願いします。
ブログランキングに参加しています。
氣前よくポチッとクリックよろしくお願いします。
にほんブログ村
いつもありがとうございます。