dastapov | Языки программирования в условиях, приближенных к боевым

После выхода второго номера журнала "Практика функционального программирования" у меня состоялась интересная переписка с неким программистом, который очень любит писать на C.

Кульминацией этой переписки стало то, что он предложил мне следующее пари: я формулирую простенькую задачу, после чего мы оба реализуем ее - он на С, я - на Haskell. После этого в условие вносятся небольшие коррективы (моделируем поведение требований в реальном мире), а мы вносим коррективы в наши программы. Результаты сравниваются по скорости исполнения, объему потребляемой памяти, количеству строк кода.

Мой оппонент изначально был поставлен в неравные условия, т.к. я мог подобрать задачу так, чтобы ее было удобно реализовывать мне, и неудобно реализовывать ему. Впрочем, я постарался выбрать задачу так, чтобы ее решение не требовало каких-то узкоспециальных знаний. Фактически, мы занимались тем, что читали из файла и обрабатывали некую сложную структуру данных. (Детальное условие я тут не привожу, чтобы не "сбивать прицел" второй половине поста).

Моя первая версия активно использовала Data.Generics и библиотечные парсеры на их основе, поэтому выиграла в размере и читаемости кода, но пролетела по объему потребляемой памяти. Впрочем, мой оппонент настолько понадеялся на мощь C, что решил не использовать библиотечный qsort, а реализовать insertion sort самостоятельно. Это самым пагубным образом сказалось на производительности (LOCs - строки кода, память - в мегабайтах, время - в секундах):

	LOCs	MEM max	Runtime, sec
Haskell, v1	72	580	88
C++, v1	861	55	383

Кроме того, выяснилось, что мой оппонент всячески "срезает углы" в погоне за производительностью. Например, функция сохранения обработанных данных в файл принимала, в числе прочих, числовой параметр, на который умножались определенные поля структуры перед сохранением - таким образом экономился один рекурсивный обход всей структуры данных.

В результате я тоже решил "срезать углы", и принести красоту кода в жертву скорости. Мой же оппонент взялся за qsort, и к вторые (финальная) версии нашего кода "финишировали" с такими результатами:

	LOCs	MEM max	Runtime, sec
Haskell, v2	169	130	8
C++, v2	950	54	5

Я предполагал, что соотношение цифр будет гораздо сильнее не в пользу Haskell. Впрочем, меня по-прежнему можно было бы обвинить в предвзятом подходе к формулированию условий.

К чему я все это веду?

Существует классическая статья "Haskell vs. Ada vs. C++ vs. Awk vs. ... An Experiment in Software Prototyping Productivity", написанная в 1994-м году. За 15 лет многое изменилось, и, думается, многим было бы интересно прочитать подобную статью про положение дел сегодня.

В связи с этим ищутся:
1)Условия подходящей задачи (критерии см. ниже)
2)Желающие реализовать ее на Haskell/C+/Ocaml/Java/Scala/C#/... с тем, чтобы ваш код был нещадно сравнен с другими и опубликован для всеобщего обозрения.

Q:Зачем все это делается?
A:На других посмотреть, себя показать. В частности, чтобы люди имели возможность посмотреть на решения на других языках, и составить о них какие-то мнение.

Q:Чем не устраивает The Great Language Shootout?
A:Тем, что там отдается предпочтение "быстрым и грязным" решениям, которые всячески "срезают углы". Во-первых, в таком стиле пишется дай бог чтобы 5% от всех программ, во-вторых, людям, не знающим язык X, строго противопоказано смотреть на решения на языке X в Language Shootout - останется превратное впечатление.

Q:Как будут сравниваться решения, чтобы определить победителя?
A:Никак, т.к. победителей не будет. Будут приведена определенная статистика по всем решениям, без выводов.

Q:Какой тогда стимул участвовать?
A:На других посмотреть, себя показать :)

Какой должна быть задача?
1)Не заточенной под конкретную ОС (т.е. "Реализовать компонент, встраеваемый в Word" или "плагин для libpam" - не катит)
2)Не заточенной под конкретный язык/фреймворк/... (т.е. "получить список сигнатур методов всех объектов указанной сборки .Net" - не катит)
3)Если глубокие знания в предметной области дают решающее преимущество - это fail (т.е. "реализовать DES-CBC" - не катит)
4)Чтобы она не была из категории "мне не нужно, чтобы плац был чистый, а нужно, чтобы вы задолбались" (т.е. "распарсить XLS-файл, не пользуясь библиотеками" - не катит)
5)Задача не должна требовать много времени на реализацию (если это будут человеко-недели - никто за нее не возьмется)

Какой должна быть реализация?
1)Чтобы ее было не стыдно показать другим. В частности, чтобы решение на языке X не заплевали бы как кривое и неидиоматичное другие программисты, знающие язык X.
2)Идеально было бы давать две реализации: первую с ориентиром на "красоту", "образцово-показательность" и легкость поддержки/развития кода (т.е. пишем как пример кода, который будет прилагаться к резюме :), а вторую - "грязную и быструю".
3)Т.к. библиотеки - это неотъемлимая часть силы и популярности языка, библиотеками "общего назначения" (контейнеры, парсинг, ...) пользоваться можно и нужно
4)Но! Решение, которое свелось к исключительно к нахождению и использованию какой-то (узкоспециальной) библиотеки никому не интересно и рассматриваться не будет.

Выбирать подходящее условие будет жюри, представляющее апологетов всех течений и направлений, в том числе - включающее тех, кто критически отзывался о материалах, уже вышедших в fprog.ru.

Если у вас есть идея подходящией задачи и вы хотите ей поделится - напишите комментарий, а?

Flat | Top-Level Comments Only

From:

lionet.livejournal.com

Ну так что это за тест, где маллок нужен всего один. Миллион элементов не у каждого потребителя всегда ровно миллион. Динамизм имплайед.

From:

akkort.livejournal.com

для динамических вариантов существуют быстрые и простые приемы ухода от миллионов malloc'ов, поэтому его скорость вообще не влияет на решение.

From:

http://users.livejournal.com/_adept_/

Они либо простые, либо быстры обычно :)

(Сейчас придет

faceted_jacinth и расскажет про malloc 1000000 и mallco 10)

From:

akkort.livejournal.com

проблема malloc в том, что он универсальный и заточен под беспорядочное выделение и освобождение. если принять, что выделять надо много раз, а освобождать сразу скопом, то проблема решается в 10 строк кода.

From:

lionet.livejournal.com

И другая проблема решается десятью строками кода. И третья. В итоге лаконичность и приближенность к предметной области куда-то исчезает.

Наверное, каждый, кто пишет на C/C++ профессионально, вынужден был в какой-то момент свой кастом мемори аллокатор написать.

В двадцать первом веке.

Тьфу.

From:

akkort.livejournal.com

я вообще давно обратил внимание, что программирование на С/С++ без использования мозга в практических целях неприменимо. меня лично это ничуть не пугает, а только радует.

From:

lionet.livejournal.com

Поэтому некоторые и любят программировать на хаскеле по этой причине: радости больше всего доставляет.

Только она другого уровня: не механическая (ещё класс, ещё темплейт, ещё один аллокатор), а математическая.

Ещё нужно учитывать, что большинство этих людей C/C++ знают очень даже на уровне, часто экспертном. Поэтому противопоставление хаскелистам сиплюсплюсных решений и аргументов забавно: аргументы из прошлой жизни. Ностальгия.

From:

akkort.livejournal.com

ну лично я пишу на С, поэтому мне в основном приходится работать не классами, темплейтами и аллокаторами, а в лучшем случае массивами, структурами и указателями.
и радость мне доставляет изучение ассемблерных листингов скомпилированного кода и бюджеты за мою работу.
мы с вами думаем на разных языках.

From:

lionet.livejournal.com

Да ладно! Я сам сишник в основном. А в cisco писал для встроенной железки, в том числе не-интеловской (MIPS), в том числе на её ассемблере. И до циски писал на C, в том числе на ассеблере x87. Несколько сотен тысяч строк кода на си.

Так что, опять же, все эти задачи я понимаю, знаю, и люблю.

... плюс теперь хаскель. Это позволяет лучше потом на си писать.

From:

akkort.livejournal.com

и что, реально за программы на haskell платят деньги?

From:

lionet.livejournal.com

Да. Почитай мой дневник, там наши вакансии есть в некотором количестве.

From:

akkort.livejournal.com

флеш, js нашел. про haskell ни слова

(no subject)

From:

lionet.livejournal.com - Date: 2009-11-04 12:11 am (UTC) - Expand

From:

http://users.livejournal.com/_adept_/

Уж на что я не "enterprise programmer", но даже мне платят. Раз мне платят, то, думаю, другим тем более платят.

(deleted comment)

From:

lionet.livejournal.com

всего лишь фасад для вызова API ОСи

Это неверно. Распространённые реализации malloc делают практически всю работу в юзер-спейсе, и делают это SMP-ориентированно, cache-friendly и с кучей диагностических фишек, которые сама по себе OS обеспечить не может.

Но если действительно что хитрейшее - то возможность написать свой аллокатор может быть очень кстати.

Никто не спорит с этим.

Почитал все обсуждение - это да, ФП программирование применимо к узенькой предметной области.

К какой?

(deleted comment)

From:

lionet.livejournal.com

1. судить о медленности malloc - потому что он таков и должно быть
2. говорить что в 21ом веке обязательно нужно писать свой аллокер - потому что их написано тьмы.

Внутренне противоречивый абзац. Если бы malloc не был медленным, то в 21м веке свои маллоки бы не писали. Более того, конечно не должно нужно писать свой маллок в 21 веке — но приходится — см. мой опыт в Cisco несколькими постами выше.

Прикладная математика, олимпиадные задачи, утилиты парсинга/генерации

А это ничего что с FP программируют телефонию (Erlang)?

Ничего, что с FP программируют веб сервисы (Facebook Chat — Erlang, Twitter — Scala)?

Ничего, что процессоры моделируют и проектируют (thesz — это ведь не совсем прикладная математика, олимпиадная задача, и утилита парсинга)?

не первый месяц слежу за блогами ФПшников и форумными дебатами вокруг ФП - адептам ФП видней, а они только такие задачи и "решают"

Смотри второй выпуск http://fprog.ru/, там начало серии статей про применение FP в реальных проектах.

(deleted comment)

From:

lionet.livejournal.com

Из этого наброса сложно вычисляется тезис. Но попробую.

1. Функциональные языки менее распространены, чем нефункциональные. Это правда, это исторически обусловленно.
1.1. Скорость выполнения, например, просасывала по-полной императивным языкам. Но каким языкам? Она просасывала языкам типа C, которые сейчас явно не в фаворе. А те языки, которые в фаворе (Java, C#) отличаются от современных функциональных языков на какой-то эпсилон.
1.2. Уровень абстракции, быстро достигаемый с помощью функциональных языков, был не нужен в восьмидесятых годах. Тогда ещё занимались инфраструктурой, обслуживанием машин (там C рулил), а не высокоуровневой аналитикой.

2. Функциональные языки применимы только в узких областях. Нет, это неправда.
2.1. Они применимы в гораздо более широких областях, чем принято считать. Впрочем, количество проектов в этих областях у функциональных языков будет необходимо меньше, чем количество проектов в тех же областях, делаемых на императивных языках. Смотри пункт 1, почему: чисто статистически, менее распространённый язык будет меньше представлен в какой либо, выбранной наугад, области.
2.2. Функциональные языки вертикально масштабирются до самых требовательных применений. Обратим внимание: несмотря на то, что они менее распространены, во почти всех областях, где они используются, они достигают самых высоких мест по важным критериям: способности выдерживать нагрузки, способности инженеров справляться с объемом получившегося кода, etc. Это показывают примеры с Facebook, Twitter, Amazon.

3. FP никто не использует в России. Это неправда. Источники были уже приведены. Если после этого возникает вопрос, почему их так мало, то, логично, смотри пункт 1, про распространённость языка.

4. Россия — третий мир, и наиболее рутинные задачи будут спускаться сюда, в аутсорс, в существенной степени определяя рынок и используемые технологии (PHP, Java, etc). Кто это сказал? Кто здесь? Может и верно.

5. Наш проект (4+ mln $ финансирования, двадцать программистов в России) использует OCaml + Erlang в качестве основной рабочей лошади.

6. Даже если FP где-то рулит, то использовать нужно мейнстримные языки. Ну это кому как — мне интересно не соревноваться с толпой программистов на Java или C#, пишущих очередные опердени. А на более экзотических задачах, где стандартные библиотеки уже не спасают, функциональные языки имеют преимущество. Поэтому выбор — ориентироваться на мейнстрим, или ориентироваться на странные платформы — он целиком индивидуальный.

Заодно отвечу про Erlang и Scala.

"Мог быть - каким угодно" — не мог: немутабельность состояния — это существенная фича для эрланга, она идёт рука об руку с многопоточностью, поэтому императивным он быть не мог. Императивный эрланг называется Go, и сосёт.

Если Scala не рассматривать как функциональный язык, или Erlang не рассматривать как функциональный язык, мы получим, что распространённый функциональный язык всего один: Haskell.

Потому что и в LISP, и в OCaml существенный блок их реализации полагается на сайд-эффекты и императивные алгоритмы и структуры данных.

Рассматривать же FP == Haskell — это слишком узко, чтобы такая точка зрения была полезной.

(deleted comment)

(no subject)

From:

lionet.livejournal.com - Date: 2009-11-21 01:43 pm (UTC) - Expand

(deleted comment)

(no subject)

From:

thesz.livejournal.com - Date: 2009-11-21 05:41 pm (UTC) - Expand

(deleted comment)

Re: ...continue (2/2)

From:

lionet.livejournal.com - Date: 2009-11-21 01:20 pm (UTC) - Expand

Re: ...continue (2/2)

From:

ormuz.livejournal.com - Date: 2009-11-21 04:12 pm (UTC) - Expand

Re: ...continue (2/2)

From:

lionet.livejournal.com - Date: 2009-11-22 07:42 am (UTC) - Expand

Re: ...continue (2/2)

From:

eao197.blogspot.com - Date: 2009-11-24 07:30 am (UTC) - Expand

Re: ...continue (2/2)

From: (Anonymous) - Date: 2011-08-18 12:10 pm (UTC) - Expand

From:

thesz.livejournal.com

>>Ничего, что процессоры моделируют и проектируют (thesz — это ведь не совсем прикладная математика, олимпиадная задача, и утилита парсинга)?
>И сколько сотен программистов занимаются моделированием процессоров? Или, ужас - тысяч! Какая широкая предметная область :)

Каждая производящая процессоры или системы на кристалле компания вынуждена держать штат моделирующих программистов. Даже, если пользуется внешними ядрами процессоров. Таких компаний десятки, если не сотни. Самих систем SoC тоже - тысячи, если не десятки тысяч. По программисту на систему, вот и рынок в тысячи программистов. ;)

>Мало того, у меня вообще ощущение что thesz - единственный профессиональный програмист на ФП во всем рунете.

Есть и ещё, есть. ;)

Нас много. ;)

From:

lionet.livejournal.com

Про проблему в маллоке и как она решается специальным аллокатором, лично мне небезинтересно прочитать вот это:

http://www.cs.umass.edu/~emery/pubs/berger-oopsla2002.pdf

После этого, впрочем, был вынужден делать ДВА general-purpose аллокатора памяти для Cisco. Наверное, чужой опыт меня не убедил.

From:

kirill a. korinskiy (from livejournal.com)

Дык, сколько же фана. Написать, а потом отладить. Особенно отладить. Блин.

From:

lionet.livejournal.com

Так юность и прошла.

From:

kirill a. korinskiy (from livejournal.com)

Хочешь сказать ты сейчас откажешься от фана?

От отладить еще один malloc, верю, откажешься, ибо ты уже это сделать. А вот от того, что ты еще не сделал?

From:

kirill a. korinskiy (from livejournal.com)

gnu libc? универсальный?

Да вы что. Он из коробки, на маленьких кусочках делает brk. И как вы хотите делать free? Если подойти к процессу с фантазией, то можно очень сильно раздвинуть сегмент данных.

Flat | Top-Level Comments Only

dump -0f - /dev/mind

Я знаю Haskell, OCaml, GSM, эндофункторы и много других страшных слов

Языки программирования в условиях, приближенных к боевым

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

Re: ...continue (2/2)

Re: ...continue (2/2)

Re: ...continue (2/2)

Re: ...continue (2/2)

Re: ...continue (2/2)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

Profile

May 2022

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags