Big data изменяют Китай
Шрифт:
Сегодня волна третьего этапа повсеместных вычислений стремительно движется на нас, крошечные смартфоны по своим свойствам уже ни в чём не уступают полноценным компьютерам, всё меньше становятся разнообразные датчики, бурно развиваются тэги RFID (радиочастотной идентификации), всё ближе устройства, которые могут быть вмонтированы в мир вокруг нас.
Тэги RFID получили широкое применение в розничной продаже, медицине, городском управлении, системах кормления животных и других областях. В последние два года в Шанхае и Учжэне непрерывно развивают сферу применения умных контейнеров для мусора, внутри которых установлены датчики RFID, в режиме реального времени считывающие количество положенного мусора и объём хранения. Контейнеры также могут автоматически «уведомлять» дворников о том, какой из них наполнен и требует очистки, что в значительной мере повысило эффективность работы в сфере городского управления. RFID меняет и авиаиндустрию. В 2019 году
«Начальным годом эры носимой электроники» можно считать 2012 год, когда были выпущены очки Google Glass. После этого одно за другим стали появляться носимые электронные устройства – миниатюрные электронные устройства, которые можно носить на себе и которые не стесняют движений. Такие устройства могут регистрировать физическое положение человека, на котором они находятся, количество сожжённых им калорий, температуру тела, сердцебиение, режим сна, количество шагов, показатели здоровья и другие данные. В 2015 году опубликованная в СМИ фотография игроков команды Китая на Кубке Азии по футболу, тренирующихся в чёрных «бикини», заняла одно из самых высоких мест в рейтинге «горячих запросов». В действительности же привлекательно минималистичные тренировочные майки футболистов представляли собой не что иное как носимое электронное оборудование под названием GPSports, способное вести сбор и мониторинг таких параметров, как расстояние, которое пробежал спортсмен, траектория его бега, скорость, ускорение и изменение частоты сердечных сокращений. На основе сравнения и углублённого анализа данных тренер может разработать план тренировки, определить состав, ко-торый будет участвовать в матче, непосредственно в ходе матча принять ключевые командные решения [7].
Приведём ещё один пример. Французский производитель спортивного инвентаря Babolat установил на ручки теннисных ракеток датчики, способные регистрировать параметры состояния в то время, когда игрок ударяет по мячу, в частности тип удара (форхенд или бэкхенд), точку удара в мяч, силу удара по мячу, скорость мяча, направление вращения мяча и др. Все эти данные практически в режиме реального времени передаются в находящиеся здесь же, на спортивной площадке, смартфоны и планшеты тренеров и спортсменов, предоставляя им доступ к данным в любое удобное время. На Открытом чемпионате по теннису в Австралии 2014 года «первая леди» китайского тенниса Ли На использовала ракетку именно этой фирмы. В целях содействия использованию таких ракеток Международная федерация тенниса (International Tennis Federation, ITF) поменяла в 2013 году устав: начиная с января 2014 года спортсменам разрешалось использовать на международных соревнованиях ракетки с датчиками для того, чтобы записывать и анализировать собственные данные. На будущих соревнованиях при условии согласия спортсмена возможна даже демонстрация собранных данных на установленных непосредственно на месте состязаний экранах для широкой публики.
Использование датчиков быстро вошло не только в футбол и теннис, но и в бейсбол, регби и другие виды спорта. По мнению одной исследовательской организации США, выручка спортивной индустрии США в ближайшие несколько лет может существенно возрасти, и главная причина этого заключается как раз в изменении характера функционирования индустрии в целом, вызванном технологией сбора и анализа данных с помощью датчиков.
Носимое электронное оборудование имеет множество других применений, помимо спорта, уже даже крошечные подгузники начали наращивать «собственный ум». В 2015 году китайский бренд Backkom изобрёл умные подгузники нового типа: с помощью Bluetooth установленное внутри подгузника лёгкое интеллектуальное устройство для считывания температуры привязывается к телефону того, кто ухаживает за ребёнком, и каждый раз, когда ребёнок пописает, чувствительное интеллектуальное устройство посредством мелодии или вибрации об этом уведомляет. Кроме того, продукты, аналогичные наиболее репрезентативному среди носимых электронных устройств изделию – одно время модным очкам Google Glass, – получили широкое распространение и за пределами развлечений. В феврале 2018 года Чжэнчжоуская железнодорожная полиция самой первой в железнодорожной системе Китая использовала полицейские очки для сопоставления лиц. По сообщениям новостей, такие очки способны путём идентификации лиц проводить скрининг пассажиров и выявлять среди них правонарушителей, чтобы тем самым улучшить общественный порядок и обстановку в поездах [8].
Сущность повсеместных вычислений состоит в том, что физическая среда повседневной жизни человека широко наполняется
1.3. Социальные медиа: всеобщий вклад, или Как каждый из нас производит данные
Подлинный «взрыв данных» произошёл в эпоху социальных медиа.
С 2004 года на свет одно за другим стали появляться социальные медиа, например: Facebook и Twitter, – что стало толчком к началу новейшей эры в истории Интернета – Веб 2.0. До этого основное назначение Интернета состояло в распространении и совместном использовании информации, главной формой организации чего были интернет-сайты. Однако сайты статичны. С наступлением эры Web 2.0 Интернет начал становиться проводником для происходящих в реальном времени взаимодействия, коммуникации и коллаборации.
Помимо обеспечения невероятного по уровню роста возможностей для взаимодействия и коллаборации ещё одна важная роль социальных медиа состоит в предоставлении площадки для бесчисленного количества пользователей Интернета со всего мира, благодаря чему они могут в любое удобное время и в любом удобном месте фиксировать свои поступки и мысли. Это фиксирование, по сути своей, и является тем, что вносит вклад в производство данных. Выше мы уже говорили о том, что все данные являются искусственно произведёнными, все данные – это выполняемые нами в отношении реального мира измерения, фиксации и вычисления. Начиная с 1946 года, когда с изобретением вычислительного устройства человечество вошло в информационную эру и ещё не были созданы социальные медиа, данные главным образом производили и собирали информационные системы и датчики. Однако в связи с внезапным появлением социальных медиа человек начал и сам производить данные в Интернете. Публикуемые пользователями записи в Weibo и отправляемые ими через WeChat сообщения, фиксирующие личные действия и поступки, – такие данные получили название «поведенческие», их отношение к другим типам данных показано на рисунке 1.6.
Благодаря появлению социальных медиа пользователи Интернета со всего мира начали становиться создателями данных. Каждый из нас, будто информационная система или датчик, непрерывно создаёт данные. Это повлекло за собой беспрецедентный по своему размаху «взрыв данных».
Помимо резкого увеличения объёма данных социальные медиа привели также к усложнению устройства вселенной данных. Кто-то, создавая пост в микроблоге, прикрепляет изображение, кто-то – видео, произведённые ими данные и по размеру, и по структуре совершенно различны. В связи с отсутствием строгой структуры данные, созданные в социальных медиа, называются также неструктурированными.
Рисунок 1.6. Разные данные с точки зрения размера и типа
Примечание: взаимное влияние разных типов данных. Коммерческие данные могут естественным образом содержать в себе и производить данные о поведении человека и окружающей природной среде, точно так же данные о поведении человека и окружающей природной среде являются взаимовключающимися, перекрёстными и взаимовлияющими. В прошлом мы фиксировали что-либо, только предварительно выбрав, что именно должно быть зафиксировано. В эпоху больших данных мы выбираем то, что зафиксировано быть не должно, и затем удаляем запись об этом. По мере непрерывного расширения сферы фиксирования можно быть уверенным: в будущем совокупный объём данных, имеющихся в распоряжении человека, будет нарастать подобно снежному кому.
Обработка подобных данных несопоставимо сложнее, чем обработка данных, имеющих строгую структуру. 15 марта 2019 года сервис микроблогов Sina Weibo опубликовал «Отчёт о развитии пользователей Weibo в 2018 году», согласно которому по состоянию на четвёртый квартал 2018 года среднее количество текстов, которые пользователи сервиса публиковали в сутки, составил 130 миллионов, среднее количество публиковавшихся за сутки изображений – 120 миллионов, среднее количество публиковавшихся за сутки видео и проведённых прямых эфиров – более 1,5 миллионов. Для сравнения: суммарный объём информации, опубликованной New York Times за прошедшие пятьдесят лет, не превышает 3 миллиардов слов.