スクレイピングや奈良漬や「お前のようなアホ」や

投稿日:

 昨年頃だったか。

 若い人――若い、と言ってもそこそこオッサンだが――とIT活用談義をしていて、この「スクレイピング」という言葉が出てきた。まるで初めて聞く言葉のような気がした。いや、必ずしも「初めて聞く」でもなく、聞いたことがないわけでもなかったのだが、耳慣れぬ言葉ではあった。しかし、その時の会話の文脈と、scraping という英語から意味はすぐに通じ、その若い人に「スクレイピングって、何ですか?」などと()き直さなければ解らないということはなかった。

 今で言う、この「スクレイピング」ということを私が最初にやりだした頃には、スクレイピングという言葉が抑々(そもそも)なかった。だから「無料自動収集」だとか「クローリングしてサニタイズして格納」だとかいうような言葉で表現していた。もっとも、私がしていたこと(他人の過去の言葉尻を(とら)えた掲示板での粘着荒らし行為(苦笑)だとか株価データの収集だとか、特定領域のニュース記事の巡回収集だとか)は個人的なくだらんことで、その仕組みを他人に説明する必要はまったくなかったから、わざわざ無料自動収集などという持って回った言葉を使う必要もほとんどなかったのだが。

 今は Python (など)の言語を用いれば、様々なライブラリやプラグインが豊富にあるらしく、Web を巡回してデータを(あさ)ることなど誰でも簡単にできるようである。しかし、私などがそうしたことを始めた頃には周囲にそういうことをしている人はおらず、ネットを(あさ)っても情報は少なく、いきおい、最初はTCP/IPのソケットから書き起こしたものを用い、次いで Perl・CPAN の「LWP」などという Web ライブラリを用いた。今も現役で稼働させている、株価を Yahoo! から取得するスクリプトは、Perl 内から「wget」を呼び出し、必要なデータを切り出す仕組みだ。

 全くのところ、こんなもの「手作りスクレイパー」もいいところである。フロントエンドのスクレイパーのみならず、現役で株価の分析に使っている自作プログラムは、私に幾許(そこばく)の利益をさながら点滴のようにしたたらせ続けてはいるものの、これなど古めかしいかな生の C で書いたもので、ソースコードの冒頭にはそれこそ「#include <stdio.h>」か、せいぜい「math.h」ぐらいしか書いていない。AI などとは程遠い実に簡単・単純なものでしかないのである。

 それらを動かし始めたのは20年前~15年前のことで、そこから(ほとん)ど進歩させていないし、私の IT 技能もほとんど進歩せず、停滞したまま、否、むしろ後退すらしている。

 私は、自分が必要としていることや自分がしたいことは、自分が理解できるコンピュータ技術やプログラミング技術を使って、大概(たいがい)のことならすぐにできる。だが、それを他人が使えるように工夫してやったり説明してやったりなど、面倒臭くて、もうしたくない。それに、当節流行のビッグデータだの AI だのということは、全然わからないしできない。覚えるのも、いまや奈良(なら)(づけ)のようになってしまっている私の脳味噌には荷が勝つから、もう億劫(おっくう)で、嫌だ。他人を使役できるような身分ではないから、自分にできない何かを誰かに肩代わりして貰えるような人望もないし、だいたい、そんな気がハナッから、ない。

 「お前が勿体(もったい)ぶって隠している、しょうもない、お前みたいなアホでもわかる計算機の秘密をとっとと教えろ!」みたいな、そんな、私をバカにした態度の輩に説明を求められ、それでも私は誠実に少し説明しかけるのだが、大概は私が10秒喋るか相手が100文字読むかしないうちに、もう面倒臭がられて説明は(さえぎ)られてしまう。テメェが説明を遮るのが理解できない原因なのに、「これだからコンピュータ屋は説明が下手糞だと言うんだ!ちったァ日本語を鍛えろ」などと吐き捨てられてしまう。そんな連中のお遊びの相手は、もうほとほと嫌だ。

 そんなアレやコレやが、最近の私の、人様から見れば無気力極まるITへの冷淡っぷりの、原因の幾つかなのだと思う。

投稿者: 佐藤俊夫

 50代後半の爺。技術者。元陸上自衛官。2等陸佐で定年退官。ITストラテジストテクニカルエンジニア(システム管理)基本情報技術者

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください