Big Data/Data science
-
2021-06-13 14:41:12
Анализ влияния технологий ИИ на геополитику
-
2021-06-08 13:35:14
Коммерческие компании, государственные и общественные организации всегда стремились узнать как можно больше о своей аудитории. Возраст, предпочтения, доходы, транзакции — чем больше данных накапливалось у организации о своих клиентах, тем более точными и адресными могли быть коммуникации и предложения. Сейчас практически каждое действие человека оставляет цифровой след в сети: поисковые запросы, звонки и смс-сообщения, перемещения, покупки. Все это формирует массивы Big Data — незаменимый источник знания о потребителе. Как работают большие данные, какие возможности они открывают перед бизнесом и потребителем и почему будущее уже наступает Хайтек+ рассказал Юрий Карев, начальник управления процессов и стандартов моделирования ВТБ.
-
2021-04-28 03:53:00
Все привыкли ассоциировать обработку больших данных с Hadoop (или Spark), которые реализуют парадигму MapReduce (или его расширения). В этой статье я расскажу о недостатках MapReduce, о том, почему мы приняли решение отказываться от MapReduce, и как мы приспособили Akka + Akka Cluster на замену MapReduce.
-
2021-02-25 13:10:30
Друзья, всем привет, меня зовут Анастасия, сейчас занимаю позицию Senior Data Scientist.
На своем канале я делюсь с вами своим опытом в области образования, карьеры, саморазвития и Data Science. Также на моем канале вы можете увидеть уроки по python, анализу данных и машинному обучению. -
-
2021-02-21 09:57:27
Преимущества и недостатки обычных мер расстояния
-
2020-07-09 16:44:15
Вся отличная визуализация данных начинается с хороших, чистых данных. Большинство считают, что сбор больших данных будет трудной работой, но это неправда. На сайте доступны тысячи бесплатных наборов данных, готовых для анализа и просмотра любым пользователем.
-
2020-01-27 05:30:58
Here’s what you need to know about the largest data repository in the world
-
2018-02-27 12:21:27
центральное событие года по теме больших данных и аналитики
-
2017-12-08 12:19:53
Конференция и ресурсы, посвященные большим данным
-
-
2017-01-31 20:50:21
Человек любит играть с цифрами или цифры с человеком? В классическом среднем образовании есть забавный парадокс: школьников натаскивают зазубривать правила и случаи их применения, но чем больше ученик знает правил и исключений, тем чаще имеет возможность совершить ошибку.
-
2017-01-31 20:39:29
Slon составил краткое руководство по офлайновым, онлайновым и другим способам освоить науку данных и понять, стоит ли вам этим заниматься
-
2017-01-14 07:42:53
Я расскажу, почему именно сейчас Data Science оказывается одной из главных причин радикального изменения информационных технологий – а через них, в свою очередь, промышленности и жизни людей в целом. Ситуации, когда алгоритмы эффективно заменяют людей и меняют целые отрасли рассмотрены на примерах как сервисов Яндекса, так и некоторых других крупнейших мировых компаний. При этом наряду с повышением эффективности и другими достижениями возникают и неприятные побочные эффекты, способные в итоге повлиять на веками складывавшиеся в человеческом обществе институты – об этом тоже важно знать.
-
2016-04-26 14:32:53
Человечество вступило в эпоху больших данных - время, когда объем доступной для анализа информации нарастает на порядки быстрее чем вычислительные мощности. Традиционные математические методы и модели в такой ситуации становятся неприменимы. Необходимо создание "новой математики", адаптированной под новые соотношения между данными и вычислительными ресурсами. Как можно хранить и обрабатывать многомерные массивы в линейных по памяти структурах? Что дает обучение нейронных сетей из триллионов триллионов нейро
-
2016-03-07 16:28:47
В качестве определяющих характеристик для больших данных отмечают «три V»: объём (англ. volume, в смысле величины физического объёма), скорость (англ. velocity в смыслах как скорости прироста, так и необходимости высокоскоростной обработки и получения результатов), многообразие (англ. variety, в смысле возможности одновременной обработки различных типов структурированных и полуструктурированных данных)
-
-
2016-03-07 16:09:23
Можно предвидеть наступление времени, когда только исключительные индивиды будут в состоянии соответствовать уровню информационного развития цивилизации, то есть быть воистину цивилизованными и воистину людьми. Потом отстанут и они, и цивилизация понесется вперед - уже не просто никем не управляемая, но и никем в целом не воспринимаемая, - как вихрь, проносящий мимо кучи пыли и какие-то непонятные обломки. Между человеком и человечеством становится все меньше общего, так что смысла лишается сама корневая связь этих двух слов.
-
2016-03-07 15:55:58
Even though big data is one of the most sought-after technology domains, it is still bound by challenges. Will enterprises be able to overcome this hurdle in 2016?
-
2016-03-07 15:50:48
Внезапно, будучи в полном расцвете сил, маркетинговая лошадка по кличке "Big Data" вдруг приказала долго жить. Gartner в августе 2015 года исключил Big Data из числа прорывных технологий (emerging technologies) и удалил ее с графика Hype Cycle.
-
2016-02-25 11:22:07http://www.mann-ivanov-ferber.ru/books/paperbook/big-data/
-
2016-02-25 11:17:34https://books.google.ru/books?id=n5RTAgAAQBAJ&printsec=frontcover&dq=%D0%91%D0%BE%D0%BB%D1%8C%D1%88%D0%B8%D0%B5+%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D0%B
-
2016-01-10 00:53:10
Интеллектуальный Портал Знаний statistica.ru - это глобальный мультимедийный ресурс для широкого круга пользователей, желающих развить свой интеллект, познакомиться с современными технологиями анализа данных и эффективно применять их для решения практических задач.
-
2015-03-27 05:57:54
Slon составил краткое руководство по офлайновым, онлайновым и другим способам освоить науку данных и понять, стоит ли вам этим заниматься
-
-
-
2014-11-13 11:24:44
Hadoop — проект фонда Apache Software Foundation, свободно распространяемый набор утилит, библиотек и фреймворк для разработки и выполнения распределённых программ, работающих на кластерах из сотен и тысяч узлов. Используется для реализации поисковых и контекстных механизмов многих высоконагруженных веб-сайтов, в том числе, для Yahoo! и Facebook. Разработан на Java в рамках вычислительной парадигмы MapReduce, согласно которой приложение разделяется на большое количество одинаковых элементарных заданий, выполнимых на узлах кластера и естественным образом сводимых в конечный результат.
Компания Meta и социальные сети организации, в том числе Facebook, признаны экстремистскими на территории России. -
2014-11-13 11:21:06
В 2010 году Apache Hadoop, MapReduce и ассоциированные с ними технологии привели к распространению нового явления в сфере информационных технологий, названного «большими данными» или «Big Data». Понимание того, что из себя представляет платформа Apache Hadoop, зачем она нужна и для чего её можно использовать потихоньку проникает в умы специалистов по всему миру. Зарожденный, как идея одного человека, и быстро выросший до промышленных масштабов, Apache Hadoop стал одной из самых широко обсуждаемых платформ для распределенных вычислений, а также платформой для хранения неструктурированной или слабо структурированной информации. В этой статье я хотел бы подробнее остановиться на самой платформе Apache Hadoop и рассмотреть коммерческие реализации, предоставляемые сторонними компаниями, и их отличия от свободно распространяемой версии Apache Hadoop.