У нас на работе сегодня пьют монгольский чай «Хаан». На вкус как солёный чай с молоком, непривычный, но говорят, у алтайцев вроде бы даже так принято... Что удивляет, так это дизайн продукции. Спрашивается, какого хрена на упаковке с монгольским чаем (который, к слову сказать, производится в Сингапуре) делает американский флаг!? Судите сами:
четверг, 24 декабря 2009 г.
среда, 16 декабря 2009 г.
Привет, трафарет!
Только что, в поиске трафаретных шрифтов для плоттерной резки, я наткнулся на суперский, потрясающий шрифт:
Шрифт бесплатный и доступен для скачивания на сайте gimpstuff.org или на сайте автора. Советский трафарет — сила!
Шрифт бесплатный и доступен для скачивания на сайте gimpstuff.org или на сайте автора. Советский трафарет — сила!
пятница, 11 декабря 2009 г.
Стеммер от Hunspell
Да, совсем забыл. Я давно уже хотел попробовать стеммер Hunspell (то есть такую штуку, которая приводит слова к канонической форме) на основе орфографических словарей, но руки не доходили, в том числе и потому, что существующие интерфейсы к питону не слишком хорошо обращались с юникодными строками.
В конечном счёте я отказался от второго питона совсем, и решил написать модуль на ctypes под третьим во избежание проблем с преобразованием юникода. Получившийся модуль можно скачать здесь, а искать им леммы можно следущим образом:
Словарь я скопировал из пакета myspell-ru, но следует иметь в виду, что при всей своей полноте и выверенности он не лишён недостатков:
Тем не менее, стеммер Hunspell показал куда лучшие результаты, чем, например, алгоритм Портера (Snowball). Он очень быстрый и вполне пригоден для индексирования незамороченных документов, логов и тому подобных задач, но его возможности, понятное дело, ограничиваются объёмом и структурой словаря.
А поэтому, для более продвинутого анализа лучше использовать комбинированный (словарно-алгоритмический) метод, который реализован, например, в библиотеке pymorphy, плюсом которой также является отсутствие привязки к системным библиотекам.
В конечном счёте я отказался от второго питона совсем, и решил написать модуль на ctypes под третьим во избежание проблем с преобразованием юникода. Получившийся модуль можно скачать здесь, а искать им леммы можно следущим образом:
>>> from hunspell import Hunspell >>> h = Hunspell("ru_RU.aff", "ru_RU.dic") >>> h.stem("ищет") ['искать'] >>> h.stem("суши") ['сушить', 'суша', 'сушь']
Словарь я скопировал из пакета myspell-ru, но следует иметь в виду, что при всей своей полноте и выверенности он не лишён недостатков:
>>> h.stem("лжёт") ['лжёт']
Тем не менее, стеммер Hunspell показал куда лучшие результаты, чем, например, алгоритм Портера (Snowball). Он очень быстрый и вполне пригоден для индексирования незамороченных документов, логов и тому подобных задач, но его возможности, понятное дело, ограничиваются объёмом и структурой словаря.
А поэтому, для более продвинутого анализа лучше использовать комбинированный (словарно-алгоритмический) метод, который реализован, например, в библиотеке pymorphy, плюсом которой также является отсутствие привязки к системным библиотекам.
Имбирное пиво...
...это, оказывается, совсем не пиво; оно вообще не содержит сколько-нибудь ощутимых доз алкоголя. При этом его не только легко и приятно делать, но ещё и легко и приятно пить! А делается оно следующим образом:
Перед вскрытием интернет рекомендует как следует охладить пиво в холодильнике, чтобы не произошло взрыва тары (газ под давлением), но мы не стали дожидаться тотального охлаждения и употребили напиток как был.
В разных способах приготовления также встречается совет увеличивать количество сахара и времени брожения с целью повышения содержания спирта. Опциональным компонентом также является измельчённая цедра использованного лимона. Впрочем и без неё напиток получился офигенно вкусным, а главное — он прост, как и всё гениальное!
- Стакан сахара перемешиваем с чайной ложкой дрожжей и засыпаем в пустую пластиковую бутыль (2л) через воронку.
- Небольшой очищенный кусок имбирного корня натираем на мелкой тёрке и смешиваем с соком лимона.
- Получившуюся смесь добавляем к сахару и оперативно заливаем водой (так, чтобы заполнить посудину примерно на 95%).
- Бутыль закручивается, встряхивается и несколько раз переворачивается, чтобы растворился сахар.
Перед вскрытием интернет рекомендует как следует охладить пиво в холодильнике, чтобы не произошло взрыва тары (газ под давлением), но мы не стали дожидаться тотального охлаждения и употребили напиток как был.
В разных способах приготовления также встречается совет увеличивать количество сахара и времени брожения с целью повышения содержания спирта. Опциональным компонентом также является измельчённая цедра использованного лимона. Впрочем и без неё напиток получился офигенно вкусным, а главное — он прост, как и всё гениальное!
Подписаться на:
Сообщения (Atom)