dastapov | Языки программирования в условиях, приближенных к боевым

После выхода второго номера журнала "Практика функционального программирования" у меня состоялась интересная переписка с неким программистом, который очень любит писать на C.

Кульминацией этой переписки стало то, что он предложил мне следующее пари: я формулирую простенькую задачу, после чего мы оба реализуем ее - он на С, я - на Haskell. После этого в условие вносятся небольшие коррективы (моделируем поведение требований в реальном мире), а мы вносим коррективы в наши программы. Результаты сравниваются по скорости исполнения, объему потребляемой памяти, количеству строк кода.

Мой оппонент изначально был поставлен в неравные условия, т.к. я мог подобрать задачу так, чтобы ее было удобно реализовывать мне, и неудобно реализовывать ему. Впрочем, я постарался выбрать задачу так, чтобы ее решение не требовало каких-то узкоспециальных знаний. Фактически, мы занимались тем, что читали из файла и обрабатывали некую сложную структуру данных. (Детальное условие я тут не привожу, чтобы не "сбивать прицел" второй половине поста).

Моя первая версия активно использовала Data.Generics и библиотечные парсеры на их основе, поэтому выиграла в размере и читаемости кода, но пролетела по объему потребляемой памяти. Впрочем, мой оппонент настолько понадеялся на мощь C, что решил не использовать библиотечный qsort, а реализовать insertion sort самостоятельно. Это самым пагубным образом сказалось на производительности (LOCs - строки кода, память - в мегабайтах, время - в секундах):

	LOCs	MEM max	Runtime, sec
Haskell, v1	72	580	88
C++, v1	861	55	383

Кроме того, выяснилось, что мой оппонент всячески "срезает углы" в погоне за производительностью. Например, функция сохранения обработанных данных в файл принимала, в числе прочих, числовой параметр, на который умножались определенные поля структуры перед сохранением - таким образом экономился один рекурсивный обход всей структуры данных.

В результате я тоже решил "срезать углы", и принести красоту кода в жертву скорости. Мой же оппонент взялся за qsort, и к вторые (финальная) версии нашего кода "финишировали" с такими результатами:

	LOCs	MEM max	Runtime, sec
Haskell, v2	169	130	8
C++, v2	950	54	5

Я предполагал, что соотношение цифр будет гораздо сильнее не в пользу Haskell. Впрочем, меня по-прежнему можно было бы обвинить в предвзятом подходе к формулированию условий.

К чему я все это веду?

Существует классическая статья "Haskell vs. Ada vs. C++ vs. Awk vs. ... An Experiment in Software Prototyping Productivity", написанная в 1994-м году. За 15 лет многое изменилось, и, думается, многим было бы интересно прочитать подобную статью про положение дел сегодня.

В связи с этим ищутся:
1)Условия подходящей задачи (критерии см. ниже)
2)Желающие реализовать ее на Haskell/C+/Ocaml/Java/Scala/C#/... с тем, чтобы ваш код был нещадно сравнен с другими и опубликован для всеобщего обозрения.

Q:Зачем все это делается?
A:На других посмотреть, себя показать. В частности, чтобы люди имели возможность посмотреть на решения на других языках, и составить о них какие-то мнение.

Q:Чем не устраивает The Great Language Shootout?
A:Тем, что там отдается предпочтение "быстрым и грязным" решениям, которые всячески "срезают углы". Во-первых, в таком стиле пишется дай бог чтобы 5% от всех программ, во-вторых, людям, не знающим язык X, строго противопоказано смотреть на решения на языке X в Language Shootout - останется превратное впечатление.

Q:Как будут сравниваться решения, чтобы определить победителя?
A:Никак, т.к. победителей не будет. Будут приведена определенная статистика по всем решениям, без выводов.

Q:Какой тогда стимул участвовать?
A:На других посмотреть, себя показать :)

Какой должна быть задача?
1)Не заточенной под конкретную ОС (т.е. "Реализовать компонент, встраеваемый в Word" или "плагин для libpam" - не катит)
2)Не заточенной под конкретный язык/фреймворк/... (т.е. "получить список сигнатур методов всех объектов указанной сборки .Net" - не катит)
3)Если глубокие знания в предметной области дают решающее преимущество - это fail (т.е. "реализовать DES-CBC" - не катит)
4)Чтобы она не была из категории "мне не нужно, чтобы плац был чистый, а нужно, чтобы вы задолбались" (т.е. "распарсить XLS-файл, не пользуясь библиотеками" - не катит)
5)Задача не должна требовать много времени на реализацию (если это будут человеко-недели - никто за нее не возьмется)

Какой должна быть реализация?
1)Чтобы ее было не стыдно показать другим. В частности, чтобы решение на языке X не заплевали бы как кривое и неидиоматичное другие программисты, знающие язык X.
2)Идеально было бы давать две реализации: первую с ориентиром на "красоту", "образцово-показательность" и легкость поддержки/развития кода (т.е. пишем как пример кода, который будет прилагаться к резюме :), а вторую - "грязную и быструю".
3)Т.к. библиотеки - это неотъемлимая часть силы и популярности языка, библиотеками "общего назначения" (контейнеры, парсинг, ...) пользоваться можно и нужно
4)Но! Решение, которое свелось к исключительно к нахождению и использованию какой-то (узкоспециальной) библиотеки никому не интересно и рассматриваться не будет.

Выбирать подходящее условие будет жюри, представляющее апологетов всех течений и направлений, в том числе - включающее тех, кто критически отзывался о материалах, уже вышедших в fprog.ru.

Если у вас есть идея подходящией задачи и вы хотите ей поделится - напишите комментарий, а?

Page 1 of 5 << [1] [2] [3] [4] [5] >>

Threaded | Top-Level Comments Only

From:

squadette.livejournal.com

может быть, топовые задачи из project euler?

From:

http://users.livejournal.com/_adept_/

Тут будут иметь решающее преимущство олимпиадчики-алгоритмисты. Разве что с приложением описания готового алгоритма решения :)

From:

http://users.livejournal.com/_adept_/

Ну, это как-то совсем просто. И не очень жизненно :)

From:

thesz.livejournal.com

Реализация языка с зависимыми типами данных?

Шутка. ;)

Рейтресеры.

Поиск пути в области со статическими и движущимися объектами, малой плотностью оных.

Двумерная игровая физика.

From:

akkort.livejournal.com

Мы с товарищем как-то круче соревновались: C vs CPP. С небольшим отрывом победил С. Задача такая: Есть входной файл с набором фигур: окружность, ромб, треугольник, квадрат, параллелограмм и т.п. Формулы вычисления площади есть у всех, они одинаковые, но можно их оптимизировать если хочется. Надо прочитать в память 10 млн записей и по всем записям пройтись 10 или больше проходов для вычисления площади каждой фигуры. Замеряется скорость чтения и скорость вычисления.

From:

thesz.livejournal.com

Кстати, я хотел предложить практически то же самое - смоделировать машину динамического потока данных с произвольной длиной ключа.

Для неё и программы писать легко (нет ограничений на длину ключа-контекста, значит, можно делать произвольную рекурсию) и (!) её очень интересно модифицировать.

From:

akkort.livejournal.com

Есть еще интересная задачка на динамическое программирование, поиск в ширину, табличный поиск и оптимизацию. Но для ее решения нужен мозг где-то дней на 3-5. Красивые решения со структурными данными рискуют бесполезно сожрать в 2-3 раза больше памяти.

From:

lionet.livejournal.com

Тут окамл победит, смысл мерять ничего нет. У него malloc на порядок быстрее сишного.

А если чуть более серьёзно, то эта штука меряет только перформанс. А то что на хаскеле это будет одна строка, а на си — стопятьсот, это как-бы тоже должно быть измеряемым фактором в финальном решении. То есть, задаче желательно не состоять в том, что она замеряет перформанс и/или лаконичность сама собой. На это постмортем анализ есть: что короче, и насколько при этом быстрее (медленнее).

From:

akkort.livejournal.com

смех в том, в С malloc нужен всего один, поэтому его скорость значения не имеет.
я сразу сказал, что меряли C vs C++, поэтому количество кода было одинаковым, вся заруба шла на то, что быстрее работает - файлы vs потоки, select vs virtual ну и дальше подобные мелочи

From:

http://users.livejournal.com/_adept_/

Вот, глядишь, и будет шанс посмотреть.

PS
А конечный авторма на Haskell/любом языке с patter matching - это с десяток строк

From:

lionet.livejournal.com

Ну так что это за тест, где маллок нужен всего один. Миллион элементов не у каждого потребителя всегда ровно миллион. Динамизм имплайед.

From:

http://users.livejournal.com/_adept_/

Мне кажется, что эта задача тоже из тех, в которой фору имеет человек, въехавший в соотв. предметную область глубоко. Не?

From:

akkort.livejournal.com

для динамических вариантов существуют быстрые и простые приемы ухода от миллионов malloc'ов, поэтому его скорость вообще не влияет на решение.

From:

http://users.livejournal.com/_adept_/

Они либо простые, либо быстры обычно :)

(Сейчас придет

faceted_jacinth и расскажет про malloc 1000000 и mallco 10)

From:

akkort.livejournal.com

проблема malloc в том, что он универсальный и заточен под беспорядочное выделение и освобождение. если принять, что выделять надо много раз, а освобождать сразу скопом, то проблема решается в 10 строк кода.

From:

dkrig.livejournal.com

Буду ждать анонса условия задачи - интересно будет решить ее на двух (а если повезет, то и на трех) языках программирования, которыми владею (ну или тешу себя надеждами что владею =)).

From:

lionet.livejournal.com

И другая проблема решается десятью строками кода. И третья. В итоге лаконичность и приближенность к предметной области куда-то исчезает.

Наверное, каждый, кто пишет на C/C++ профессионально, вынужден был в какой-то момент свой кастом мемори аллокатор написать.

В двадцать первом веке.

Тьфу.

From:

lionet.livejournal.com

Про проблему в маллоке и как она решается специальным аллокатором, лично мне небезинтересно прочитать вот это:

http://www.cs.umass.edu/~emery/pubs/berger-oopsla2002.pdf

После этого, впрочем, был вынужден делать ДВА general-purpose аллокатора памяти для Cisco. Наверное, чужой опыт меня не убедил.

From:

akkort.livejournal.com

я вообще давно обратил внимание, что программирование на С/С++ без использования мозга в практических целях неприменимо. меня лично это ничуть не пугает, а только радует.

From:

lionet.livejournal.com

Поэтому некоторые и любят программировать на хаскеле по этой причине: радости больше всего доставляет.

Только она другого уровня: не механическая (ещё класс, ещё темплейт, ещё один аллокатор), а математическая.

Ещё нужно учитывать, что большинство этих людей C/C++ знают очень даже на уровне, часто экспертном. Поэтому противопоставление хаскелистам сиплюсплюсных решений и аргументов забавно: аргументы из прошлой жизни. Ностальгия.

From:

akkort.livejournal.com

ну лично я пишу на С, поэтому мне в основном приходится работать не классами, темплейтами и аллокаторами, а в лучшем случае массивами, структурами и указателями.
и радость мне доставляет изучение ассемблерных листингов скомпилированного кода и бюджеты за мою работу.
мы с вами думаем на разных языках.

From:

lionet.livejournal.com

Да ладно! Я сам сишник в основном. А в cisco писал для встроенной железки, в том числе не-интеловской (MIPS), в том числе на её ассемблере. И до циски писал на C, в том числе на ассеблере x87. Несколько сотен тысяч строк кода на си.

Так что, опять же, все эти задачи я понимаю, знаю, и люблю.

... плюс теперь хаскель. Это позволяет лучше потом на си писать.

From:

akkort.livejournal.com

и что, реально за программы на haskell платят деньги?

From:

lionet.livejournal.com

Да. Почитай мой дневник, там наши вакансии есть в некотором количестве.

From:

thesz.livejournal.com

От машины Тьюринга это отличается видом в профиль.

Общий алгоритм сводится к "посмотреть на множество сообщений, выбрать готовое к выполнению, выполнить, добавить его результат в множество сообщений".

Page 1 of 5 << [1] [2] [3] [4] [5] >>

Threaded | Top-Level Comments Only

M	T	W	T	F	S	S
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

dump -0f - /dev/mind

Я знаю Haskell, OCaml, GSM, эндофункторы и много других страшных слов

Языки программирования в условиях, приближенных к боевым

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

Profile

May 2022

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags