Лучшие книги по Data Science для начинающих
Лучшие книги по Data Science для начинающих

Лучшие книги по Data Science для начинающих

Отобрали лучшие книги по Data Science для начинающих. Актуальная литература на русском языке для дата саентистов. Научитесь превращать массив данных в структурированную информацию для принятия решений.

1. Основы Data Science и Big Data. Дэви Силен, Арно Мейсман, Мохамед Али

Image

Data Science – это набор определений и концепций, с помощью которых можно наделить значением и доступным видом большие объёмы данных. Книга рассказывает об одной главной и увлекательной концепции анализа и обработки данных.

Читателя познакомят с теоретической основой, последовательностью машинного обучения, работой с большими массивами данных, NoSQL, детальным анализом текстов и визуальной информацией. В качестве примеров представлены сценарии Data Science на Python.

Обработка и анализ данных – это широко применимая отрасль в IT, именно здесь необходимы талантливые разработчики, способные создавать сценарии разной сложности, от социальных сетей до обучаемых систем. Книга послужит начальной точкой в изучении мира Data Science.

3. Наука о данных. Джон Келлехер, Брендан Тирни

Image

В современном мире наука о данных находит применение во всех областях: рекламные объявления в интернете подбираются под запросы пользователя, рекомендованное высвечивается из-за анализа просмотренных сериалов и прочитанных книг, ссылки в социальных сетях появляются по методу «знакомые», а также отсортированные входящие уходят в отдельную папку со спамом.

Читателя познакомят с базовыми принципами науки о данных. В неё включены основные аспекты, от момента становления сбора и анализа данных, до решения этических конфликтов, нарастающих из-за политики конфиденциальности. Читателю расскажут, как ведут работу нейронные сети и машинное обучение, приведут примеры изучения бизнес-проблем и покажут пути их решения. Дополнительно расскажут о тех областях, на которые наука о данных повлияет в большей степени.

5. Убийственные большие данные. Кэти О’Нил

Image

Математические алгоритмы постепенно захватывают нашу жизнь. Кэти О’Нил – это профессор математики и финансовый аналитик, считающая, что алгоритмы стали серьёзным оружием в руках государства и предприятий – это оружие изначально направлено на нуждающиеся и незащищённые слои населения.

Современные математические приложения, созданные для банков и страховых компаний, способны следить за каждым действием человека в пространстве интернета. Однако они появлялись на основе предрассудков и убеждений, которыми грешат их создатели. Основа и критерии реализации математических алгоритмов подлежат охране и строгому контролю. Добро пожаловать в мир убийственных Больших данных!

7. Практическая статистика для специалистов Data Science. Питер Брюс, Эндрю Брюс

Image

Практический учебник представлен для специалистов в сфере данных, обладающих навыком работы с языком программирования и знакомых с определением математической статистики. Здесь в доступном виде представлены основные моменты из статистики науки о данных, также объясняется, какие критерии необходимы и полезны со стороны анализа данных. Детально рассматриваются предметы:

  • разведочный анализ данных;
  • распределение данных и выборок;
  • статистические эксперименты и проверка значимости;
  • статистическое машинное обучение и обучение без учителя.

9. Data Science. Наука о данных с нуля. Джоэл Грас

Image

Читателя познакомят с миром науки о данных и научат применять знания в практической среде. Легкодоступный способ изложения помогает неопытному, но интересующемуся человеку понять аналитику без возможных сложностей.

Джоэл Грас рассказывает о языке Python, элементах линейной алгебры, математической статистике, методах сбора, нормализации и обработки данных. Дополнительно даёт информационную базу для машинного обучения. Описывает математические модели и пути их разработки по принципу «k».

11. Изучаем Spark. Холден Карау, Матей Захария, Патрик Венделл, Энди Конвински

Image

Объём данных, подлежащих обработке в человеческой деятельности, увеличивается с каждым годом. Как эффективно с ними взаимодействовать?

Apache Spark – это открытая система кластерных вычислений, позволяющая создавать высокопроизводительные программы анализа данных. С её помощью стало возможным управление большими объёмами данных посредством API на Python, Java и Scala.

Авторами книги являются разработчики системы Spark. Они расскажут об организации параллельного выполнения заданий с помощью нескольких строчек кода, также помогут разобраться в системе на примерах.

13. Data Science. Кэти О’Нил, Рэйчел Шатт

Image

Исследование данных – востребованная специализация современного времени. Изучение данных способствует преображению любой традиционной или инновационной бизнес-модели. Книга рассчитана на начинающих специалистов-аналитиков, в ней вы познакомитесь с:

  • финансовым моделированием;
  • визуализацией данных;
  • статистическими алгоритмами;
  • байесовским методом;
  • рекомендательными движками;
  • MaReduce.

15. Big data, дополненная реальность и компьютерное зрение / Интервью с Data Scientist

0
1
0
0
0
0
0
0
0
0 Комментарии

Бесплатное образование

ПРИСОЕДИНЯЙТЕСЬ