作家スコアリング

公開

これから生成AIコンテンツが、各プラットフォームに無限に投稿される
素人も生成AIコンテンツが手軽に作れるので、アカウントが次々できて
SNSや投稿プラットフォーム問わず激増している

これらの生成AIコンテンツはgoogleのクローラーとして厄介極まりない
元々AIやgoogleとしては生成AIコンテンツは無価値とみなせる
しかし数が多すぎる上にクローラーに内容を吟味するコストもかかる
SNSやweb小説は生成AI文章の温床として、クロールしないのが正解だろう

その一方で人間の文章が書く文章の学習先として、確立した存在が欲しい
その場合どうすればいいのかというと、人間の作家をマークすればいい
これから生成AIのアカウントも無限に追加されていく
一方人間の作家は有限で、数が把握できる程度には少ない

ネット上のすべての人間作家をマークして、独創性が高い作家を優先してクロールすれば
効率的に学習対象を得られる
web小説サイトの無限の作品群をクロールするよりはるかに現実的だろう

そしてこの作家スコアリングで、信憑性の高い住所とみなせるのがドメインだ
同じ作家が二つも三つもドメインをもって、作品を公開しているケースは少ない

そしてその作家が学習対象として適しているか簡潔に判定する方法
それはコラムだ
コラムは生成AI文章スコアが低くなり、人間かいた文章か判断しやすい
目的や思想も文章からすぐに読み取れる
また生成AIで文章を大量生産するようなスパマーやアフィリエイターは
コラムの類はまず書かない

総じて独自ドメインで、自分のコラム公開しているような作家の小説は
人間が書いた小説である可能性が極めて高いと判断できる
googleやaiとしてクロールの対象が高いユーザーとして評価すべき
それが作家スコアリングの概念となる

この作家スコアリングは遠い未来の話しで、今のところ一切見当もない
だが生成AI文章が爆増するような状況では、人間の作品をスコップする有効な手段になる
最近のweb小説家って自分のホムペやブログ持ってる方が希少なので、
未来に向けて検討してもいいかなと思う