Интернет-поиск радикально изменит навигацию по патентным базам

Помнящие, каково было искать в интернете в первой половине девяностых, согласятся: информация ничто, если ее нельзя найти

Шок вызывало понимание того, что на вроде бы однозначный запрос ненужное "находилось" "на раз", а вот то самое — никак. О каких-нибудь приличных материалах по высшей математике можно было даже не задумываться: найти их "в лоб" все равно не получалось. Впрочем, так было не очень долго, сообщает "Компьюлента".

Увы, если интернет слегка эволюционировал, то с патентной системой мы все еще в 1995 году. Да что там, 1994-й будет честнее... Лабиринт, зачастую без "лишних шуточек" вроде системы, смысла и логики, как знает любой, потративший несколько часов на поиск в патентных базах.

Лучано Кей (Luciano Kay) из Калифорнийского университета в Санта-Барбаре (США) пытается повторить революцию веб-поиска в патентной отрасли. Как некогда Джон Клейнберг (Jon Kleinberg) из Корнеллского университета (США), он посчитал, что связи между отдельными патентами (сайтами) говорят о значимости и содержании патентов часто больше, чем содержимое, которое автоматически анализировать все равно придется по словам, а не по их сути.

В разработке г-на Кея каждый патент — это узел сети, а попросту говоря, подключенное к ней устройство. Линку между двумя узлами приравняли ссылку одного патента на другой. После этого все сферы ("директории") были связаны между собой такими линками, что позволило количественно определить технологическую дистанцию между любыми двумя областями. Если ссылок в одной группе патентов на другую мало, то связь между областями слабее, и наоборот.

Для тестирования своего подхода исследователи взяли все патенты 2000–2006 годов в Европейском патентном офисе и создали программу для визуализации связей. Она, правда, пока в стадии отладки, но все же...

Для демонстрации возможностей нового подхода Лучано Кей и компания разместили на патентной карте нынешних патентных монстров — тех же Samsung, DuPont и IBM, а также те новые технологии, что связаны с графеном, нано- и биосенсорами (и так далее).

Дело не только в том, что на такой карте секция, скажем, A (человеческие потребности) оказалась временами весьма близка к секции, к примеру, С (химия и металлургия), но и в том, что в местах максимальной плотности связей можно отыскать самые быстроразвивающиеся области, а, напротив, в "пустотах" — наиболее медленно эволюционирующие.

Что ж, как бы сильно это ни выглядело, перед нами лишь начало пути. Многие легко вспомнят, что вслед за пониманием роли линков интернет-поиск был революционизирован Pagerank´ом — с учетом того, как часто действительно важные веб-странички ссылались на другие немаловажные.

В принципе, нет никаких причин, по которым такой принцип не может быть внедрен патентоведами: в конечном счете, это потребует лишь длительного ручного труда вначале для определения самых значимых изобретений в каждой области. Очевидно, что внедрение вот такого аналога Pagerank наконец-то позволит добиться от поиска действительно прорывных идей достойной результативности.