TBL блог търсене

March 28, 2009

Вече може да търсите във всички статии, които TopBlogLog е виждал.

Блоговете са много сериозен източник на информация, напълно конкурентен на новинарските сайтове в България. Търсенето в цялата тази информация беше абсолютно невъзможно с досега ползваното google custom search, което по-скоро отказваше потребителите от по-нататъчно търсене. Примерно sing2me сега може да ползва TBL като готварска книга.

ново търсене в топблоглог

Единственият съществен недостатък е, че TBL е млад сайт, който има данни само за 1 година назад, а много от блоговете са добавени и по-скоро. Това все пак е много информация, над 100 000 статии и 1300 блога за търсене. Иначе липсва транслитерация, разни екстри като поставяне в кавички и поставяне на минуси и плюсове, но това ще се появи при интерес.

Търсенето е реализирано със sphinx. Това средство е толкова мощно, че би се справило с многократно по-големи сайтове. Впрягането му да търси в българската блогосфера е като стрелба по муха с топ 🙂

Публикувано в: TBL 7 коментара RSS 2.0

Ако постът ви харесва, цъкнете на сърцето:

Коментари

7 коментара на “TBL блог търсене”

  1. Марти on March 29th, 2009 00:02

    Супер! Браво!

  2. Апостол Апостолов on March 29th, 2009 08:58

    Блоговете НЕ СА сериозен източник на информация. Защото се списват от некомпетентни, деизнформирани, необразовани и много често сбъркани хорица.

    Това важи обаче изцяло и за новинарските сайтове. Last not least: никой, никой не може да бъде обективен, затова е най- добре човек да търси сериозната информация другаде. А не в новините и блоговете…

  3. fen on March 29th, 2009 14:21

    Браво!

  4. пейо on March 29th, 2009 22:22

    Поздравления и от мен! А можеш ли да добавиш и броя открити резултати, за да можем да си правим БСП vs. ДСБ vs. ГЕРБ, Миков vs. Костов, Станишев vs. Първанов и т.н.т. Мисля, че разбра идеята 🙂

  5. dzver on March 29th, 2009 23:16

    Да, но данните ще са приблизителни.

    Допуснах една логическа грешка, от която не съм измислил как да изляза. Съхранявам и индексирам статии на изтрити, неподдържани, флагнати, неодобрени и физически несъществуващи блогове. За това ако върна около 845 резултата, на това ще съответстват примерно 745 живи статии и около 100 в недостъпни блогове, които няма да бъдат показани.

    Или ще започна да ги показвам, или ще спра да ги индексирам, но това ще е най-рано следващия уикенд 🙂 а числото ще се появи в сайта още преди да си видял този коментар.

  6. dzver on March 29th, 2009 23:46

    http://topbloglog.com/q/%D0%A1%D1%82%D0%B0%D0%BD%D0%B8%D1%88%D0%B5%D0%B2%20%D0%9A%D0%BE%D1%81%D1%82%D0%BE%D0%B2%20%D0%9F%D1%8A%D1%80%D0%B2%D0%B0%D0%BD%D0%BE%D0%B2%20%D0%91%D0%BE%D0%B9%D0%BA%D0%BE%20%D0%91%D0%BE%D1%80%D0%B8%D1%81%D0%BE%D0%B2

    Скролваш най-отдолу и гледаш обобщена информация:

    Думата станишев е намерена 2156 пъти в 1133 документа.
    Думата костов е намерена 1688 пъти в 597 документа.
    Думата първанов е намерена 2568 пъти в 1058 документа.
    Думата бойко е намерена 2082 пъти в 1153 документа.
    Думата борисов е намерена 1984 пъти в 953 документа.

  7. dzver on March 29th, 2009 23:47

    костов се среща 3 пъти в пост, първанов 2.5 пъти, станишев – под 2 пъти. явно костов поражда най-голяма графомания:)

Оставете отговор