引き続き吉村昭作品を読む。「敵討」。敵討ちに関する短編作品2話収録。
これは平成13年(2001)初版と言うから、吉村昭が亡くなる5年前、晩年の作品だ。
次は動物に関する短編5話収録の「羆」。
オッサンは生きている。
引き続き吉村昭作品を読む。「敵討」。敵討ちに関する短編作品2話収録。
これは平成13年(2001)初版と言うから、吉村昭が亡くなる5年前、晩年の作品だ。
次は動物に関する短編5話収録の「羆」。
サービス終了が判明したブクレコだが、結局のところ、書棚データのエクスポートは出来ないから、手近のマシンの「wget」あたりで丸ごとコピーしておくより他にない。
$ wget -kpr -l0 -t3 -T5 -np https://www.bookreco.jp/bookshelves/59112
まあ、仕方がない。
で、こうやってできた「bookshelves」ディレクトリに下りて、
$ grep -h '<p class="title">' 59112?page=* | sed -e 's/<p class="title">//' -e 's!</p>!!' -e 's/ //g' | sort | uniq | nkf -w >booklist20160503.txt
……なんぞとやっておけば、一応書名のリストだけは取れる。
残念なのは、ISBNとか読書日などの情報が全く保存できないことである。これをどうにかするには、Amazonか国会図書館のAPIでも使って変換するより他になさそうである。
しかし、ふと取得した書棚ファイルを見ると、書籍の外見イメージを取得しているところがあって、そのURLでサイトを呼ぶと、その中にISBNや出版日が書かれていることに気付いた。
なるほど。そこで、先に得た生の書棚データテキストからこのURLを切り出す。
$ grep -h 'book_image' 59112?page=? 59112?page=1? 59112?page=2? | sed -r 's!^.+(https://www.bookreco.jp/book/[0-9]+).+!\1!' >booksurl
ファイル名をシェルに展開させるにあたり、「59112?page=*」とせずに「59112?page=? 59112?page=1? 59112?page=2?」としているのは、1番から20番までのファイルがある場合、「59112?page=*」としてしまうと、そのままだと1,11,12,13,14,15,16,17,18,19,2,20,3,4,5,6,7,8,9、というふうに、辞書順に並んでしまうからである。「ブクレコへの登録が新しい順」を保持させるためには、こうするより他にない。
それから、このURLリストをwget -iに食わせ、データの入った生テキストを得る。
$ wget -O - -i booksurl | sed -rn -e '/<div class="summary">/, /<!-- \/\/end summary -->/p' >booksfulltext
更に、この生テキストのタグを除き、csvにしてしまう。これをsedなどでのみやるには、結構ゴチャゴチャ書かなければならないのだが、美しく作業する気がてんからなく、行を建て増し建て増しして書いているうちに、結局自分でもなんだかわからない、次のような謎のワンライナーになった。
$ sed -nr -e '/(<span class="bold large">)|(<ul class="floatlist_left clearfix text_thin">)/,/(<\/span>)|(<\/ul>)/p' booksfulltext | sed -e '/<span /d' -e 's/<\/span>/,/' -e '/<ul/d' -e 's/<\/ul>/-----/' -e 's/<li>出版日://' -e 's/<li>種類://' -e 's/<li>ISBN://' -e 's/<\/li>/,/' | sed -r -e 's/ +//g' -e ':loop;N;$!b loop;s/\n/ /g' -e 's/ +/ /g' -e 's/-----/\n/g' -e 's/, /,/g' -e 's/,\n$/\n/' | nkf -w
>bookscsv_utf
このようにして得たCSVをスプレッドシートに読み込ませるわけである。
残念なのは、ブクレコには読書日が入れられないので、いつ読んだ本かと言うことが消失していることだ。
驚いた、「ブクレコ」が終了するそうな。
引用……
日頃、ブクレコをご愛顧いただきまして誠にありがとうございます。 2011年からサービスをご提供してまいりましたブクレコは、2017年6月30日をもってサービスを終了させていただくこととなりました。 大変勝手ではございますが、ご自身の書評をcsvにてダウンロードしていただけるようにいたしましたのでログインしてご利用ください。 https://www.bookreco.jp/my/users/settings> の下部にご用意しております。 長らくのご利用、ありがとうございました。
※書評のダウンロードは6月30日(金)の16時までご利用可能です。
……うーん、残念&参ったなあ。無料で使える本棚アプリとして重宝してきたからなあ……。
誰だったか、「ある人の人となりを知りたければ、その人の家に行って本棚を見ると良い」と言った人があったと思うが、その点、ネットに読んだ本を露出できるこのシステムは、私如き「俺を見てくれ系」の変人には、実に便利だったのである。
さて、どうしたものかな。別のサービスを探すか、どうにかするしかないな。
それにしても困った。ブクレコには500冊を超える読書記録を入力してあるが、なんと、ブクレコには「エクスポート機能がない」のである。多分、運営元に要求してみたところで、廃止の決まったサービス、今更どうにもなるまい。うーん、参った。これを何とかしたいが……。
ほほ~……
いやはや驚いた……。ダニエル・イノウエと言えば永遠の Cpt. Ret. (退役大尉)、米陸軍日系人部隊「442戦闘団」の英雄で、欧州戦線で奮戦し、パープル・ハート勲章を与えられた隻腕の傷痍軍人である。戦傷をものともせず戦い、復員してからは政治家を志した。戦後半世紀近くの長きにわたって上院議員を務め、数年前(平成24年(2012))に亡くなったことは記憶に新しい。
ダン・イノウエ氏は日系人であって、要するにアメリカ人であるから、これが日本にとって直接どうこうということではないが、しかし、日本に源流を持つ者の栄誉は喜ばしい。
しかし……。このことが喜ばしいと思って女房子供に話したところ、愚妻ども、その第一声が
「えっ!?……ださっ!!」
……である。
……なんと言おうか、感性の相違であって、もう、どうしようもない。