Показать сообщение отдельно
Старый 12.03.2008, 18:07   #50  
mazzy is offline
mazzy
Участник
Аватар для mazzy
Лучший по профессии 2015
Лучший по профессии 2014
Лучший по профессии AXAWARD 2013
Лучший по профессии 2011
Лучший по профессии 2009
 
29,472 / 4494 (208) ++++++++++
Регистрация: 29.11.2001
Адрес: Москва
Записей в блоге: 10
попробую подвести предварительные итоги.

1. форум стал работать быстрее.
В основном сказались усилия провайдера по перенестройке сервера, но и наши запросы стали лучше. А самое главное почти не используется временные таблицы, как было при fulltext-поиске. В течение дня среднее время выполнения одного запроса не превышало 20-30 тиков (раньше доходило до 500-600).

2. за счет улучшенного определения границы слов поисковые индексы уменьшились, хотя количество индексируемых слов увеличилось (теперь индексируются 2х-буквенные слова). Сейчас поисковые данные больше контента всего в 1.7 раз (до работы над поиском размер поисковых данных превышал контент в 2.4 раза).

3. за счет улучшенного определения границы слов теперь появилась возможность получить нормальную статистику частоты использования слов. Среди хитов держится слово "не" - использовалось 75391 раз. Вторым является слово "то" - 40888 раз. Третьим является слово "если" - 32342 раза.

4. По результатам анализа уточнен список запрещенных к индексированию слов. Теперь список выглядит так:
Цитата:
на кто что до по во со то но как это этот этого того том там тут здесь из за для при про или даже же еще раз от вот ну ли мне меня вы вам вас мы они их его ее он она всех изначально бы просто там быть будет например случае конечно forums
Новый список запрещенных слов будет учтен ночью при выполенении очередных регламентных работ.

5. Хотелось бы спросить у вас, уважаемые участники? Можно ли запретить индексировать слово "не"?
Часто ли вы включаете частичу "не" в свои поисковые запросы?
__________________
полезное на axForum, github, vk, coub.