Мартин (martinthenext) wrote,
Мартин
martinthenext

Categories:

Здорово было

За свой двадцать третий год я переехал в Цюрих и перевидал столько новых и интересных для себя вещей, что и не упомнить. Вот самые интересные:


  1. Сделали с Кириллом snya.li - индексируем предложения о сдаче квартир с ВКонтакте. Число посетителей невелико, но медленно растет само собой, и набирается довольно аппетитная статистика по кликам :) Скоро буду смотреть. Еще нужно бы воспользоваться моментом перед началом семестра и написать в какие-нибудь старт-аперские места, реклама сама, видимо, не купится. С точки зрения технологий может выйти крутая шутка - если вдруг денег дадут :)

  2. Сделали проект по СтатсЛабу. Нам принесли данные обследований пациентов с повреждениями позвоночника и попросили найти самый эффективный способ их сжать до нескольких цифр, чтобы докторам было удобнее на них смотреть. Сделать то мы сделали - презентация, понятный отчет, полный отчет, код - было интересно и полезно научиться нормально писать на R. Но, если по чесноку, данные нужно докторам представлять не в качестве цифр, а в качестве рисунков. Я упомянул это в разговоре с врачами, и им понравилось - попросили написать которкую статью о проекте, на самом деле - предложить способ. Посмотрим, что выйдет, может им понравится моя идея.

  3. Думал по поводу статистического консалтинга. Очень странные сейчас средства по анализу данных, если честно. Весь код пишется в одном файлике Analysis.R, выводы и субъективные суждения не регистрируются, а результаты записываются в отчет часто без всякого обоснования. Вот если бы придумать такой git (скорее даже не git, a changes tracking), чтобы куски кода для получения статистик/графиков перемежались с аннотациями человека, на это смотрящего и делающего выводы о том, куда смотреть дальше. Тогда можно было бы восстанавливать и воспроизводить всю логику проекта начиная с данных. Я что-то такое предложил на семинаре, мне сказали, что если одному данные анализировать, все и в голове помещается. Нужно бы поинтересоваться, где люди в командах данные анализируют.

  4. Устроился на работу в Институт Компьютерной Лингвистики - очень классные ребята. У них есть тысячи био-медицинских статей на разных языках, размеченные аннотациями из domain-specific онтологии. Почти все время до этого я прогал на питоне и баше тулзы для alignment'a, а теперь буду пробовать реализовать crowdsourcing-платформу для решения разных задач типа устранения неоднозначности аннотаций. Не совсем мой любимый ontology engineering, но близко, буду стараться двигаться в этом направлении.

  5. Написал несколько русскоязычных текстов - мало, но почти все мне нравятся. Кроме здешних помню только комментарии к посту Кати Казбек - я там про творческую и техническую интеллигенцию и разницу подходов к моральным вопросам. Надо бы скопировать в ЖЖ, потеряется ведь.

  6. Прочел Zen and the Art of Motorcycle Maintainance. Предлагаемая автором монистическая философия мне очень понравилась, так он здорово разрешил "конфликт" стремлений к красоте и технологическому прогрессу. Самая запомнившаяся часть книги - рассказ про "застревание" в процессе решения технической задачи. Ведь застревание на самом деле - самое креативное время - когда действительно непонятно, что делать дальше, и нужно это как-то придумать, непонятно как. Это - самый творческий момент.

  7. Понял, что так и не обнаружил никакого культурного или языкового барьера в общении по-английски. Шутки потихоньку шутятся, намеки понимаются, всем все ясно. Чем дальше, тем лучше.

В общем, сконцентрироваться на чем-то одном (например, учебе) не удалось, и я не сильно расстраиваюсь по этому поводу :) Мой файлик main.org предлагает в дальшейшем думать, в добавок к вышеописанному, в сторону:


  1. Анализа данных из snya.li. Есть несколько неплохих, как мне кажется, идей.

  2. Gamification of crowdsourcing tasks (глупо как-то переводить было). Мой нынешний прототип платформы исполнен в духе времени (толстый клиент на JS + REST API) - воткнуть визуализации заместо вопросов в нужный момент будет просто.

  3. Causal graphs как инструмент в статистическом консалтинге.

И стараться писать почаще, полезное это дело.

Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 12 comments