Кстати, раз уж обмолвился о поиске по флэш контенту. Напишу-ка подробнее свои тёмные мысли по этому поводу.
Во-первых, совсем недавно google заявил, что собирается индексировать флэш сайты используя Search Engine SDK от чуваков. Во-вторых, проблема поиска во флэш и AJAX сайтах существует уже давно. Кто-то дублировал текст в скрытых тэгах на странице с флэшем, кто-то подменял контент для роботов. Как я уже говорил, по моим данным, за такие штуки любят банить и навсегда, потому что это самая распространенная техника так называемой черной раскрутки — отдавать поисковику то, что он хочет, а показывать какой-нибудь очередной спам. Ведь кто знает, что ты всего лишь хочешь проиндексировать свой реальный флэш контент, а не обмануть систему.
Adobe Search Engine SDK, конечно, идея хорошая, но оно почему-то не ищет по файлам скомпилированным под Flash Player 9, что делает ее совершенно неактуальной в современных условиях.
Скажите мне когда вы в последний раз делали полностью статический флэш сайт без какого-либо подгружаемого контента вообще, будь то мувиклипы или XML текст? Я сомневаюсь, что все это барахлишко будет индексироваться, особенно когда имена загружаемых файлов (пусть они статические на сервере, а не какие-то сервисы или срипты) генерируются динамически из загружаемых же источников.
А кто из вас не делал контент, который не существует в текстовом виде внутри swf файла, но в то же время отображает текстовую информацию? Вот что уж точно не будет никак индексироваться.
Что делать?
В принципе, для того, чтобы проиндексировать полностью флэш сайт, нужно его запустить в некой виртуальной машине и полностью проследить что он там делает. А именно, что загружает, что отображает и на какие кнопки реагирует. Если нед доступа ко внутренностям. Вопрос как выделить в сайте интерактивные элементы.
Или, распарсить его в какое-то промежуточное представление, в котором можно увидеть все загрузки, все тексты, все кнопки и скрипты на них. Из него можно вытащить всю информацию о том как это работает, что делает и что грузит. Потом также распарсить всё загружаемое. То есть, получается, что поисковикам нужно делать то же самое, что сейчас делают такие программы как action script viewer — ломать наши флэшки, которые мы пытаемся защитить.
Как бы в идеале
Чувакам пора бы что-то придумать по этому поводу. Например при паблишинге экспортить какие-то дополнительные поля в swf файле с информацией для поисковиков «как меня индексировать». Например помещать туда в каком-то закодированном виде информацию о том, что где и откуда флэшка грузит, какие сервисы использует. В общем, что-то для поисковиков, чтобы без распарсивания флэшки они узнавали максимально много информации для более-менее правильного индексирования контента.