Alteryx connect что это

Alteryx — достойная платформа обработки данных?

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

Oct 15 · 4 min read

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

Alteryx известна как платформа, которая сочетает в себе аналитику, обработку данных и автоматизацию процессов. Интеграция со многими инструментами может быть реализована очень легко и использована во многих примечательных случаях. Для этого обзора я использовал Google BigQuery в качестве исходной и целевой платформы.

Примеры использования

Вот несколько типичных примеров использования платформы, которые демонстрируют впечатляющие возможности Alteryx.

Подготовка данных

Хотя программные средства и облачные платфор м ы, такие как GCP, уже предлагают собственные инструменты для подготовки данных (Cloud Dataprep) или такие сервисы, как Data Transfer Service, до разнообразия инструментария Alteryx им еще далеко. На этой платформе доступны ESB-функция (интеграционная шина данных) и различные технологии аналитики/обработки данных — вы можете выбрать один из множества инструментов или использовать алгоритмы Python и R.

Еще один повод обратиться к Alteryx — доступ к локальной версии, обязательной в некоторых компаниях из-за проблем с управлением данными. В этом случае вы можете взять данные из любого источника или данные, уже загруженные в BigQuery, и подготовить их для дальнейших аналитических операций.

Вы можете воспользоваться одним из многих уже встроенных инструментов подготовки данных (показанных синими значками на изображении выше) или, как уже говорилось, предоставить возможность выполнить всю работу алгоритмам Python и R. После этого вы сможете загрузить данные обратно в новую таблицу в BigQuery с помощью инструмента вывода (BigQuery Output).

Интеграция данных

Вы также можете использовать Alteryx для ETL (процесса извлечения, преобразования и загрузки данных) / ELT (процесса извлечения, загрузки и преобразования данных). Как отмечалось выше, Alteryx предлагает широкий набор инструментов для связи с базами данных и интеграции данных.

Этот пример аналогичен вышеописанному. Вы можете извлечь данные из базы данных MSSQL, преобразовать их и, наконец, загрузить в хранилище данных. Широкий спектр источников данных, поддерживаемых инструментами ввода (как показано зелеными значками), безусловно, является большим плюсом.

Эта область применения подробно описана в истории Tropical Smoothie CAFE, источниками данных которого являются AWS (Amazon Web Services).

Отчеты и аналитика

Вдобавок ко всем вышеперечисленным возможностям, Alteryx делает акцент на аналитику, предоставляя пользователям средства для создания отчетов. У многих компаний есть необработанные данные в хранилище или в озере, на основе которых нужно создавать отчеты. Alteryx поможет справиться с довольно сложными задачами анализа и обработки данных, такими как:

После выполнения аналитической и статистической работы можно использовать один из многих поддерживаемых инструментов BI и BI Server для загрузки данных. Я загрузил свои данные на сервер Tableau.

В этом случае Alteryx станет просто находкой для обработки данных, потому что инструменты BI не предлагают широкого спектра аналитических возможностей. Аналогичный случай использования описан Siemens в этой истории.

Заключение

Alteryx — это больше, чем просто инструмент для анализа данных. Он также предназначен для решения задач интеграции данных и может похвастаться множеством средств связи с системами и базами данных. Вместе с такими технологиями, как BigQuery, а также множеством других программ и баз данных, вы можете реализовать интеграцию и подготовку данных, а также отчеты и различные аналитические методы.

Что мне особенно нравится, так это возможность выбирать между множеством инструментов Alteryx (с поддержкой операции перетаскивания мышью) и использовать алгоритмы Python или R. Сочетание этих возможностей создает отличную платформу для интеграции и аналитики данных. Это позволит вам и вашей компании использовать широкий набор инструментов для решения непростых проблем изменчивого мира, управляемого большими данными.

Источник

Зачем мне нужен Alteryx? Какую лицензию выбрать?

Alteryx — это средство для обработки и объединения нескольких источников данных, которые потом можно экспортировать в Tableau. Tableau Online может сводить данные из нескольких источников в единый формат. Но только при некоторых условиях:

Если же источников несколько – например, база данных и разрозненные отчеты сотрудников – возникают проблемы с экспортом хранилищ данных. Конечно, можно попробовать настроить Tableau. Но чем разнообразнее отчеты и данные, тем выше риск возникновения технической ошибки. Для приведения информации к единому формату и стилю были созданы специальные программные решения, одно из них — Alteryx.

Разработчик Alteryx позиционирует свой продукт, как программу для продвинутой аналитики. По сути, Alteryx выполняет функции Data Blending.

Что такое Data Blending и чем этот метод работы с информацией отличается от традиционных способов обработки данных?

Например:
Допустим, нам необходимо провести A/B-тестирование. При традиционном методе аналитик использует информацию из какого-то одного сервиса, допустим, Google Analytics. На большую часть вопросов сервис действительно даст ответы, но если компании нужна глубокая аналитика, потребуется статистический анализ. А вот этот функционал уже отсутствует в Google Analytics.

Чтобы провести глубокий анализ необходимы результаты опросов, онлайн- и оффлайн-данные, которые собираются сотрудниками вручную. Alteryx «из коробки» позволяет в короткое время начать статистический анализ данных. Важно, что менеджеру-аналитику не нужно владеть языком программирования, достаточно знать функционал того или иного инструмента Alteryx.

Какие бывают лицензии Alteryx?

У Alteryx существует два продукта: Designer и Server.

Alteryx позволяет записывать преобразованные данные в файл или создавать поток данных, которые с заданной периодичностью будут экспортироваться в Tableau.
Хотите узнать, как провести анализ и сделать отчеты быстро?

Нам доверяют:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

Назад к Базе знаний
Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

Alteryx — аналитическая платформа для комбинированного и углубленного анализа данных. Это прекрасное средство для обработки и объединения нескольких источников данных, которые потом можно экспортировать в Tableau.

Источник

Исследование данных о коронавирусе с помощью Alteryx

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

В этой статье я кратко расскажу о некоторых возможностях Alteryx на примере данных о динамике эпидемии коронавируса.

Материал будет интересен тем, кто имеет начальный уровень знаний о платформе Alteryx, использовать которую может даже человек без специального образования. Прочитав статью, вы сформируете базовое представление о ситуации с коронавирусом на основе реальных данных, а не громких заголовков жёлтой прессы.

В качестве анализируемого датасета я выбрал данные, предоставляемые институтом Джона Хопкинса, которые выложены в свободном доступе на GitHub (https://github.com/CSSEGISandData/COVID-19). Этот датасет включает в себя данные из дюжины источников и претендует на полноту информации об эпидемии.

Предоставляемые институтом данные агрегируются в csv-файлы и обновляются ежедневно. В конце дня создаётся новый файл, соответствующий этому дню. Структура данных такова:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

В первую очередь, мне хотелось бы построить графики общего количества зарегистрированных случаев, выздоровевших и летальных исходов в зависимости от дней, а затем, видя эти графики, сделать обоснованные предположения о том, какой динамики развития эпидемии можно ожидать в будущем.

Итак, начнём с графиков. Чтобы построить их с помощью Alteryx, я выполняю следующую последовательность шагов.

Шаг 1. Вносим данные в Alteryx.

На первом же этапе возникает небольшая сложность, состоящая в том, что формат данных за февраль немного отличается от формата январских данных и поэтому мне нужно создать два блока Input Data:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

Знак «?» в имени файла интерпретируется Alteryx’ом как «любой символ». Соответственно, в данном случае в первый блок считаются все файлы в указанной папке, имя которых начинается с «01-» и заканчивается «-2020.csv», т.е. все файлы за январь. Во второй Input Data попадут данные за ферваль.

Затем я объединяю данные в одну таблицу с помощью блока Union. В результате получаем таблицу, состоящую из 2480 строк и содержащую все имеющиеся у нас данные:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

Шаг 2. Приводим данные к единому формату.

В первую очередь, займёмся датами. После того как мы прочитали данные из csv-файлов, они находятся в текстовом формате. Чтобы с ними было удобно работать, я преобразую их в формат «Date». Кроме того, есть ещё один нюанс — формат дат за февраль отличается от январского формата.

Поэтому добавляю в Workflow два блока DateTime, чтобы пропарсить даты:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

В настройках блока DateTime выбираем нужный нам формат:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

Внимательный читатель заметит, что изначально в поле Last Update также содержалось и время апдейта, которое мы теряем после оговоренных преобразований. Все верно, для наших целей нужна только дата апдейта, а время существенной роли не играет.

В результате получаем две новых колонки с данными, которые содержат уже не строки, а данные типа «Date»:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

Теперь хотелось бы, чтобы все даты были в одной колонке. Кроме того, данные о подтвержденных случаях заболевания, смертях и выздоровлениях сейчас также пребывают в текстовом формате, хотя по своей природе являются числами.

Я добавляю блок Formula в Workflow, чтобы это исправить. Затем с помощью блока Select, я уберу старые ненужные колонки в текстовом формате и оставлю новые, которыми мы будем пользоваться в дальнейшем.

На этом этапе Workflow выглядит следующим образом:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

Блок Formula настроен следующим образом:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

В первой формуле записываем в колонку DateTime_Out значение из колонки DateTime_Out_Feb, если в ней сейчас Null. В итоге в колонке DateTime_Out окажутся все даты и за январь, и за февраль.

В блоке Select просто оставляем колонки, которые всё ещё нам нужны:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

В итоге имеем полностью пропарсенный и приведенный к единому формату датасет:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

Шаг 3. Строим графики.

Чтобы построить графики, я добавлю в Workflow блоки Summarize, Interactive Chart и Browse Tool.

Блок Summarize настраиваю следующим образом:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

То есть, группируем данные по дате, и затем по каждой дате суммируем количество смертей, выздоровлений и зарегистрированных случаев заболевания. На выходе этого блока получаем данные, готовые для построения графика:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

Блок Interactive Chart настраивается интуитивно понятным образом. Мои настройки выглядят так:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

То есть, ничего особенного. График типа «Line», по оси X дата, по оси Y — нужное нам значение (на рисунке это количество выздоровевших). Создаём три таких графика, добавляем Browse Tool для просмотра этих графиков и нажимаем Run:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

В итоге наблюдаем, что число заболевших продолжает стремительно расти, хотя даже невооруженным взглядом видно, что примерно с середины февраля скорость этого роста падает. Говорит ли это о том, что точка насыщения уже достигнута и дальше количество заболевших будет медленно расти, а затем в какой-то момент пойдёт на спад? Полагаю, что одному лишь Богу известно, так ли это.

Однако последние десять дней несомненно добавляют оптимизма, т.к. экспоненциальный рост количества зарегистрированных случаев таки прекратился. Более того, количество выздоровевших резко увеличивается и кривая выздоровевших почти повторяет кривую зарегистрированных случаев заболевания с запаздыванием примерно в 12 дней.

Шаг 4. Строим график смертности

В свете этих рассуждений явно напрашивается вопрос о том, каков же шанс у человека умереть, если он заболел коронавирусом?

Понятно, что в идеале смертность должна считаться как «количество умерших» поделенное на «общее количество заболевших». Однако такая формула работала бы, если бы эпидемия уже давно закончилась или если бы у нас было большое количество данных. На данный же момент, в каждой точке графика присутствует высокий процент людей, которые все ещё болеют. В будущем, когда эти люди вылечатся или умрут, это скорее всего окажет существенное влияние на итоговый показатель смертности, посчитанный при текущих данных.

Учитывая всё предыдущее, я введу метрику смертности как «количество умерших»/ («количество умерших» + «количество выздоровевших»). Совершенно ясно, что эта метрика не претендует на абсолютную истинность, однако построив график такого показателя, мы все-таки можем сделать некоторые выводы о картине происходящего.

Итак, я добавляю в Workflow ещё одну ветку:

Alteryx connect что это. Смотреть фото Alteryx connect что это. Смотреть картинку Alteryx connect что это. Картинка про Alteryx connect что это. Фото Alteryx connect что это

Здесь в блоке «Formula» я подсчитываю показатель смертности согласно введённой выше метрике и затем строю график.

Источник

Инвестидея: Alteryx, потому что упало, но может подняться

Сегодня у меня очень спекулятивная идея: взять акции производителя ПО Alteryx после их недавнего сильного падения, чтобы заработать на отскоке.

Потенциал роста: до 23%.

Срок действия: до 12 месяцев.

Почему акции могут вырасти: падение акций было слишком большим, а так перспективы у компании неплохие.

Без гарантий

Наши размышления основаны на анализе бизнеса компании и личном опыте наших инвесторов, но помните: не факт, что инвестидея сработает так, как мы ожидаем. Все, что мы пишем, — это прогнозы и гипотезы, а не призыв к действию. Полагаться на наши размышления или нет — решать вам.

Если хотите первыми узнавать, сработала ли инвестидея, подпишитесь на Т⁠—⁠Ж в «Телеграме»: как только это станет известно, мы сообщим.

И что там с прогнозами автора

Исследования, например вот это и вот это, говорят о том, что точность предсказаний целевых цен невелика. И это нормально: на бирже всегда слишком много неожиданностей и точные прогнозы реализовываются редко. Если бы ситуация была обратная, то фонды на основе компьютерных алгоритмов показывали бы результаты лучше людей, но увы, работают они хуже.

Поэтому мы не пытаемся строить сложные модели. Прогноз доходности в статье — это ожидания автора. Этот прогноз мы указываем для ориентира. Как и с инвестидеей в целом, читатели решают сами, стоит доверять автору и ориентироваться на прогноз или нет.

На чем компания зарабатывает

Alteryx делает ПО для анализа данных. Ее облачная платформа имеет следующие функции:

Почему акции компании упали

На прошлой неделе у Alteryx вышел отчет за минувший квартал. Он был не очень хорош: выручка выросла меньше ожиданий, были огромные убытки, а прогнозы итогов года оказались хуже ожидаемых.

Компания относится к числу «перспективных технологических стартапов», акции которых растут благодаря высоким темпам роста выручки. Торможение этих темпов вызвало гнев и разочарование инвесторов — акции упали почти на 30%.

Но компания, на мой взгляд, неплохая. Я считаю, что нам представилась возможность заработать на восстановлении акций.

Инвестиции — это не сложно

Аргументы в пользу компании

«Я не убыточный стартап, я жизнеспособный бизнес, не банкротьте меня!» Если посмотреть на данные за предшествующие периоды, то можно увидеть, что Alteryx — это вполне адекватное предприятие, которое может показывать прибыль. Конечно, последние несколько кварталов дела идут не так круто, как хотелось бы, но это во многом связано с коронавирусом и карантином: начиная с марта 2020 года экономику в США ставили на паузу, что сказалось на отчетности Alteryx.

Есть такой стереотип, что ИТ-компании обладают иммунитетом к коронавирусу, поскольку они могут работать удаленно. Но суровая правда в том, что ИТ-компании зарабатывают на заказах из обычных отраслей или в лучшем случае получают заказы от других айтишников, зависящих от офлайн-клиентов.

У Alteryx свыше 7 тысяч клиентов в 12 отраслях, из которых минимум 5 — розница, энергетика, здравоохранение, производство и сфера гостеприимства — сильно пострадали во втором квартале 2020 года.

Компания не называет конкретные доли своих крупнейших клиентов в структуре выручки, но в годовом отчете, перечисляя своих крупнейших клиентов, первым делом она называет японскую авиакомпанию All Nippon Airways и нефтегазовую Chevron. Видимо, доля страдающих от карантина офлайн-бизнесов среди клиентов Alteryx очень велика.

Все это означает, что постепенное возвращение экономики в норму и снятие карантина вернут спрос на ПО Alteryx в пострадавших отраслях на прежний уровень. Котировки акций должны будут подтянуться вслед за выручкой.

Машины и данные. По исследованию Gartner, компания лидирует среди предприятий, работающих в сфере машинного обучения и аналитики данных.

Само по себе это ничего не значит. Более того, я считаю, что в текущем виде вся эта аналитика данных, искусственный интеллект и большие данные — это скорее обман инвесторов, которые в массе своей не понимают, что это такое, и, как вороны, ведутся на все яркое и блестящее. Как тут не вспомнить историю стартапа ScaleFactor, выдававшего толпу бухгалтеров за искусственный интеллект.

Еще, учитывая не самую плохую финансовую историю компании, ее вполне может купить какой-нибудь Google, чтобы развить свои компетенции в сферах ИИ и машинного обучения. От новостей о покупке акции вырастут еще лучше, чем от действий спекулянтов.

В пользу этой версии говорит разбор отчетности компании, где хорошо видно, что основной виновник убытков — это отдел продаж, который пожирает большую часть валовой прибыли. Если бы компанию купил гигант вроде Google, то он вполне мог бы порезать расходы на этот отдел в 3—4 раза и передать функции по продажам услуг Alteryx своему отделу продаж, который мог бы работать с уже имеющейся огромной пользовательской базой самой Google.

Капитализация Alteryx составляет чуть больше 8 млрд долларов, и ее покупка крупной компанией — это вполне возможный вариант развития событий.

Источник

Новая нефть: как стать миллиардером на обработке данных

В середине августа в отеле Crawford в Денвере претворяются в жизнь заветы древнекитайского мыслителя Сунь-Цзы. Дин Стокер, глава компании Alteryx, специализирующейся на data science, вызвал сюда своих менеджеров на ежегодную сессию по выработке стратегии. Мероприятие называется «Бин Фа», в переводе с китайского — «Искусство войны», знаменитого труда Сунь-Цзы. Древнекитайский мыслитель много внимания уделял экономии ресурсов, отмечает Стокер. «Например, он ставил вопрос о том, как победить в войне, не участвуя в битве», — говорит бизнесмен.

«Меня спрашивают: «Вы когда-нибудь рассчитывали так вырасти?» — говорит бизнесмен. — А я отвечаю: «Да, просто я не думал, что это займет так много времени».

Простой интерфейс главного продукта Alteryx, одноименного средства для обработки данных, позволяет всем, от недавних выпускников до почетных директоров, превращать сырые числа в диаграммы и графики. Возможности Alteryx намного шире, чем у Excel. Введите несколько чисел, выберите нужную операцию — например, «очистка данных» или «линейная регрессия» — и готово.

Применение Alteryx можно найти в любой отрасли. Coca-Cola пользуется ей, чтобы помочь ресторанам определить, сколько напитка заказывать, авиалинии — чтобы хеджировать цену самолетного топлива, банки — чтобы моделировать деривативы. Анализ данных — это «навык, который необходим всем нам, если мы хотим выжить в новую эпоху, — говорит Стокер. — Более важный, чем умение сводить баланс».

Отец Стокера был на все руки мастер. Он строил цистерны для жидкого азота для NASA, а потом бросил работу и стал продавать каркасные летние дома в Колорадо. Он изготавливал их самостоятельно. «По девять месяцев в году он трудился буквально в одиночку и заготавливал древесину для пятидесяти построек», — вспоминает Стокер. Со временем Стокер стал работать вместе с отцом, так что изучение экономики в Колорадском университете в Боулдере он уже смог оплатить сам.

Окончив университет в 1979 году, Стокер получил степень MBA в Пеппердайне, а потом в 1990 году занял позицию менеджера по продажам в Donnelley Marketing Information Services, компании по анализу данных из Коннектикута. Там он познакомился с Либби Дуэйн Адамс, которая работала в офисе фирмы в Стэмфорде. Семь лет спустя они основали собственную компанию по анализу данных и дали ей длинное название Spatial Re-Engineering Consultants. Львиная доля в компании досталась Стокеру как автору идеи.

SRC с самого начала приносила прибыль. «Мы не тратили больше, чем позволяла выручка. Мы не нанимали больше, чем позволяла выручка, — говорит Адамс. — Мы никогда не подсчитывали скорость сжигания капитала. Это была популярная тема во времена подъема доткомов. Мы не управляли бизнесом как доткомом».

В 2006 году, в продолжение одного из разовых консалтинговых проектов, SRC выпустила программу, которая позволяла клиентам самим справляться с числами. Они назвали программу Alteryx — шутка для ботаников об одновременном изменении двух переменных: «Изменить Y, X». В 2010 году Стокер переименовал компанию в Alteryx.

Отрасль data mining и анализа данных существует уже давно, и здесь есть и множество стартапов, и гиганты вроде Oracle и IBM. Однако, как утверждает Стокер, Alteryx почти не сталкивается с конкуренцией.

«Это не слишком конкурентная область, — говорит Маршалл Сенк, старший исследователь из Compass Point Research & Trading. — Вы можете или купить готовую программу у Alteryx, или собрать 15 разных продуктов и ломать голову, как заставить их работать вместе».

В офисе Alteryx Стокер останавливается перед тайм-лайном, на котором изображены его первые 22 года в бизнесе. «Самое главное еще даже не произошло, — говорит он. — Мне понадобится стена намного больше».

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *