Това просто е desktop -а на компютъра, на който работя. И като на всяко работно място там има какво ли не. Но в повечето случаи, каквото си оставил там ти трябва най-много, когато си далеч. Така че защо да си го нямам online . И без това след като ми отгърмя хостинга на http://metawire.org , сайта си ми е на компютъра вкъщи.
Автоматизиран преглед на печата: засега това са само български ежедневници достъпни в Интернет.
За довеждане на българските думи до някаква основна форма ( stemming ) съм използвал леко окастрен модула „граматика“ на http://bgoffice.sf.net . За съжаление българският език не се поддава толкова лесно на тази процедура. Винаги съществува двусмислие. Например, „бил“ е форма на „бъда“, „съм“ и „бия“, едно нещо може да бъде глагол и съществително („брой“) и т.н. За да си намали това двусмислие трябва граматичен анализатор. Засега моята интуиция е да ползвам Parse::RecDescent , но не ми се захваща още с това.
За анализ на смисловата близост на документите използвам една техника, която изобщо не е измислена за това, а за търсещи машини. Нарича се „търсещи машини с векторно пространство“ (Vector space search engines), чиято теория е добре описана в този PDF. Заел съм някои моменти (например използването на PDL) от тази примерна реализация на подобна търсеща машина.
P.S. От днес (6.02.2005) седмицата на седмичния преглед на печата не е точно седем дни, а три дни. Тя всъщност никога не е била и седем дни, а най-много пет. Ако някой го интересува преглед на по-дълъг период нека помогне с малко памет.
От доста време съм си пуснал статистика на посещенията на сайта ми. Напоследък взе да ми става интересно да я поглеждам от време на време: хората попадат на този сайт търсейки какви ли не неща. Ако ви е интересно и на вас – погледнете ги. Обновяват се веднъж дневно: около 7 часа EST.
Накрая си спретнах сайт:
1. Конвертиране на документи от OpenOffice до DocBook с този шаблон ;
2. Трябваше да пипна малко XSLT шаблоните на N.Walsh за да ми правят HTML по мой вкус;
3. Написах 2-3 шаблона, които да ми генерират навигация и индекси, а да не ги мисля;
4. Накрая един Makefile който да ми сглобява всичко заедно, когато се добавя или променя нещо...
... и то взе, че стана!