Tuesday, May 30, 2017

Стройте рожи

Готовая (натренированная) система распознавания лиц и определения эмоций. На OpenCV.

IMDB gender classification test accuracy: 96%.
fer2013 emotion classification test accuracy: 66%.

Не что, а как

Очень верное замечание о построении цифровой экономики - важно не что строится, а как. Переиспользование - это основа коммерческого применения любого программного обеспечения. И думать нужно не о 50 умных городах, а о платформе, на которой их делать. Что такое FI-WARE, например, и зачем это нужно, так в России, увы, никто и не знает.

Friday, May 26, 2017

Wi-Fi пульс

Удаленный мониторинг здоровья по отражению Wi-Fi сигналов. На самом деле, может еще использоваться для скрининга в системах безопасности аэропортов, например. У кого тут сердце часть бьется?

Wednesday, May 24, 2017

Как анализировать данные

CRISP-DM - методология для анализа данных. То есть, последовательность шагов (этапов) для процесса data mining. Истоки - консалтинговая компания The Modeling Agency.

Адаптированное описание CRISP-DM от IBM

Русская статья: CRISP-DM: проверенная методология для Data Scientist-ов

Tuesday, May 23, 2017

О тестировании систем

Интересная статья о тестировании систем. В первую очередь, авторов интересуют большие распределенные системы.

almost all (92%) of the catastrophic system failures are the result of incorrect handling of non-fatal errors explicitly signaled in software.

Friday, May 19, 2017

Deep Learning для всех

Учебный курс по Tensorflow из Стенфорда. Слайды, заметки, программное обеспечение. Интересно, что многие вещи можно делать без установки программного обеспечения. Активно используют облако от SageMath

/via Поиск учебных курсов

P.S. см. также другие публикации по Deep Learning

Все в одном

Python и все библиотеки для data science. Один пакет для загрузки

Monday, May 15, 2017

База машинного обучения

Очень полезная статья о базовых элементах machine learning. Feature engineering is the key. Все определяется отбором факторов.

См. также другие публикации по теме machine learning

Saturday, May 13, 2017

Введение в ML

Пара толковых русскоязычных презентаций по машинному обучению

Введение в машинное обучение

Введение в Deep Learning

См. также другие публикации по теме machine learning

Очень личное

AI инструменты и приложения, которые можно попробовать для персонального использования

Sunday, May 07, 2017

Об анонимных финансовых данных

Интересная статья о ре-идентификации пользователей по анонимным мета-данным финансовых транзакций. Шаблоны поведения (где, когда и на какую сумму была покупка) оказываются довольно специфичными. И зная частично детали, можно легко понять в анонимном вроде бы логе, кто есть кто.

Wednesday, May 03, 2017

INJOIT том 5, номер 5

Вышел новый номер журнала INJOIT. Это пятый номер в 2017 году. Тема года - цифровая экономика.

Темы статей:

  • автоматическое обнаружение и оценка цветовых искажений с использованием карт доверия
  • прогнозирование загрузки кластерной системы с использованием адаптивных смесей моделей
  • Pareto-optimal Algorithms for Metric TSP: Experimental Research
  • телекоммуникации как решающее звено цифровой экономики. Опыт США
  • review on the Performance of Non-Cooperative Spectrum Sensing Based on Energy Detection
  • Веб Вещей и Интернет Вещей в цифровой экономике
  • строительство и инженерия на основе стандартов BIM как основа трансформаций инфраструктур в цифровой экономике
  • архитектурный подход к разработке эталонной модели «единого окна»
  • оценка уровня зрелости для ИТ-компании

Архив журнала находится здесь.

/via Лаборатория ОИТ

Tuesday, May 02, 2017

Конференция по анализу данных

Москва, МГУ имени М.В. Ломоносова, 2017.

Конференция «Аналитика и управление данными в областях с интенсивным использованием данных» (“Data Analytics and Management in Data Intensive Domains” (DAMDID)) планируется как мультидисциплинарный форум исследователей и практиков из разнообразных областей науки, содействующий сотрудничеству и обмену идеями в сфере анализа и управления данными в условиях их интенсивного использования. Ожидается, что подходы к анализу данных и управлению данными, развиваемые в конкретных областях X- информатики (таких как астро, био, гео, нейро, медицина, физика, химия, и пр.), социальных наук, а также различных отраслей информатики, промышленности, новых технологий, финансов и бизнеса составят существенный вклад в контент конференции.

Подать статью

P.S. А что было в 2016 году можно посмотреть здесь.

Спортивный анализ данных

Monday, May 01, 2017

Лучшие глубинные практики

С чего начать построение deep learning приложений. Интересен приводимый список приложений со ссылками на arxiv.org

См. также другие публикации по теме deep learning

Измерения в цвете

t-SNE - популярный подход для визуализации данных большой размерности. А вот здесь предлагают делать это в цвете. Выглядит очень интересно.