четверг, 24 декабря 2009 г.

Оксюморон

У нас на работе сегодня пьют монгольский чай «Хаан». На вкус как солёный чай с молоком, непривычный, но говорят, у алтайцев вроде бы даже так принято... Что удивляет, так это дизайн продукции. Спрашивается, какого хрена на упаковке с монгольским чаем (который, к слову сказать, производится в Сингапуре) делает американский флаг!? Судите сами:


среда, 16 декабря 2009 г.

Привет, трафарет!

Только что, в поиске трафаретных шрифтов для плоттерной резки, я наткнулся на суперский, потрясающий шрифт:



Шрифт бесплатный и доступен для скачивания на сайте gimpstuff.org или на сайте автора. Советский трафарет — сила!

пятница, 11 декабря 2009 г.

Стеммер от Hunspell

Да, совсем забыл. Я давно уже хотел попробовать стеммер Hunspell (то есть такую штуку, которая приводит слова к канонической форме) на основе орфографических словарей, но руки не доходили, в том числе и потому, что существующие интерфейсы к питону не слишком хорошо обращались с юникодными строками.

В конечном счёте я отказался от второго питона совсем, и решил написать модуль на ctypes под третьим во избежание проблем с преобразованием юникода. Получившийся модуль можно скачать здесь, а искать им леммы можно следущим образом:

>>> from hunspell import Hunspell
>>> h = Hunspell("ru_RU.aff", "ru_RU.dic")
>>> h.stem("ищет")
['искать']
>>> h.stem("суши")
['сушить', 'суша', 'сушь']

Словарь я скопировал из пакета myspell-ru, но следует иметь в виду, что при всей своей полноте и выверенности он не лишён недостатков:

>>> h.stem("лжёт")
['лжёт']

Тем не менее, стеммер Hunspell показал куда лучшие результаты, чем, например, алгоритм Портера (Snowball). Он очень быстрый и вполне пригоден для индексирования незамороченных документов, логов и тому подобных задач, но его возможности, понятное дело, ограничиваются объёмом и структурой словаря.

А поэтому, для более продвинутого анализа лучше использовать комбинированный (словарно-алгоритмический) метод, который реализован, например, в библиотеке pymorphy, плюсом которой также является отсутствие привязки к системным библиотекам.

Имбирное пиво...

...это, оказывается, совсем не пиво; оно вообще не содержит сколько-нибудь ощутимых доз алкоголя. При этом его не только легко и приятно делать, но ещё и легко и приятно пить! А делается оно следующим образом:
  1. Стакан сахара перемешиваем с чайной ложкой дрожжей и засыпаем в пустую пластиковую бутыль (2л) через воронку.
  2. Небольшой очищенный кусок имбирного корня натираем на мелкой тёрке и смешиваем с соком лимона.
  3. Получившуюся смесь добавляем к сахару и оперативно заливаем водой (так, чтобы заполнить посудину примерно на 95%).
  4. Бутыль закручивается, встряхивается и несколько раз переворачивается, чтобы растворился сахар.
Вот собственно и весь процесс. Смесь ставится в тёплое место на 24 часа. Некоторое время спустя пиво начнёт бродить, что будет заметно по выделению пузырьков. Готовность определяется по твёрдости бутылки — если пластик продавливается пальцем, значит пусть бродит ещё немного...

Перед вскрытием интернет рекомендует как следует охладить пиво в холодильнике, чтобы не произошло взрыва тары (газ под давлением), но мы не стали дожидаться тотального охлаждения и употребили напиток как был.

В разных способах приготовления также встречается совет увеличивать количество сахара и времени брожения с целью повышения содержания спирта. Опциональным компонентом также является измельчённая цедра использованного лимона. Впрочем и без неё напиток получился офигенно вкусным, а главное — он прост, как и всё гениальное!