ぼっけえきょうてえ

立命館情報工学科がなんかやらかしたらしいと、ネットで大騒ぎみたいですね。
伝聞の伝聞。

論文を読んでないしもう読めそうもないから中身については言及できないけど、ぼんやり思うことを書いてみる。
データセットのソースとしてpixivを選んだのは、わりと自然じゃないかなーって思うんですよね。
だってさ、
・サンプルがたくさんある
・暗号化されてない扱いやすいフォーマットである(多分)
・18禁属性であることが保証されている
・上手なのからへたくそなのまで幅広く揃っていて、ジャンルも表現もバリエーション豊か
って、データセットとしてはかなり理想的よね。
ポルノをテーマに選んだのも、「文字表現と意味するところがとてもかけ離れている、AIによる暗喩の理解としてはうってつけのジャンル」って面があるからだろうし。

なんか「商業作品でやれ!」みたいな突っ込みもありましたけど、たくさん揃えたらお金かかるし、筆者の恣意的なチョイスだって言われるし、文学だかポルノだかわかんないのもあったりするし、電子書籍ファイルをベタテキストに変換するのも手間かかるしさ。

ただ、ポルノが有害かどうかを判断するのは情報工学の役目じゃないし、多分に筆者の感情的な物言いだから科学論文としたら真っ先に避けなければいけない言いぐさだよなあと思います。

なんだろ、論文タイトルが「人工知能による暗喩表現、特にポルノの認識と識別」みたいなのだったらもうちょっと反応が違ったんじゃないかな。
「ついにAIがエロを理解する日が来た!」みたいなね。


とはいえ、ポルノが有害だという人間がいて、ポルノをAIで分別する技術があって、あとはポルノを社会から排除すべきだっていう風潮が強まると、とんでもない社会が出現しそうな気がするよね。
「ポルノ」を「反戦論者」に置き換えたらまんま第2次大戦中の日本やん。
そしていつでもなんにでもポルノという言葉は置き換わりうるというね。


聞いた話によりますと、中国は別に表現の規制だとかはしてないそうですね。
表現の規制に非協力的なプロバイダを規制してるだけで。
あとは勝手にプロバイダやらIT業者が勝手に色々忖度して自主的に規制をかけるんだそうで。


怖いねえ。恐ろしいねえ。