Аналіз настрою - Поради Excel

Аналіз настрою в Excel! Існує безкоштовна надбудова від Microsoft Labs, яка дозволяє аналізувати настрої в Excel. Що робити, якщо вам доведеться перебирати сотні коментарів до опитування, щоб побачити, що люди думають про вашу компанію? Excel може призначити ймовірність, яка показує, наскільки позитивним чи негативним є кожен коментар.

Переглянути відео

  • Кількісно оцінити дані обстеження, коли це вибір із множинним вибором
  • За допомогою зведеної таблиці можна з’ясувати, який відсоток має кожна відповідь
  • Але як щодо текстових відповідей у ​​вільній формі? Їх важко обробити, якщо їх у вас сотні чи тисячі.
  • Аналіз настрою - це машинний метод прогнозування позитивної чи негативної відповіді.
  • Корпорація Майкрософт пропонує інструмент для аналізу настрою в Excel - машинне навчання Azure.
  • Традиційний аналіз настроїв вимагає від людини аналізу та класифікації 5% тверджень.
  • Традиційний аналіз настроїв не є гнучким - ви відновите словник для кожної галузі.
  • Excel використовує лексикон суб'єктивності MPQA (про це читайте на http: // bit. Ly / 1SRNevt)
  • Цей загальний словник включає 5097 негативних та 2533 позитивних слів
  • Кожному слову присвоюється сильна або слабка полярність
  • Це чудово підходить для коротких речень, таких як твіти чи публікації у Facebook
  • Його можна здурити подвійними негативами
  • Щоб встановити, перейдіть до Insert, Магазин Excel, знайдіть машинне навчання Azure
  • Вкажіть діапазон введення та два порожні стовпці для діапазону виводу.
  • Заголовок для діапазону введення повинен відповідати схемі: tweet_text
  • Супутня стаття за адресою: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/

Стенограма відео

Дізнайтеся Excel з подкасту, епізод 2062: Аналіз настрою в Excel

Ей, це була ніч Подяки, і ми сиділи біля гарбузового пирога, і Джес, наш друг, заговорив про аналіз настроїв у даних Twitter. І я сказав: "Гей, ти знаєш, що Excel має спосіб аналізу настроїв". І я зрозумів, що не маю хорошого відео на цьому чи будь-якому відео на цьому, тому це відео стосується аналізу настроїв у Excel.

Тепер перше питання полягає в тому, що, біса, це аналіз настроїв? І якщо ви опитуєте своїх клієнтів, і у них є вибір з кількох варіантів, де вони можуть вибрати від 1 до 5, ну, це насправді, дуже легко проаналізувати. Ви можете просто створити невелику зведену таблицю: Вставте зведену таблицю, Існуючий аркуш прямо тут, натисніть кнопку ОК. Ми хочемо знати там питання чи відповідь на запитання, а потім, скільки відповідей було на кожне, і це дає нам абсолютну цифру. Ви навіть можете зайти сюди і змінити це з налаштувань поля на Показати значення як% від загальної кількості стовпців, наприклад.

Добре, щоб ви могли бачити для кожної відповіді, який відсоток людей отримує відповідь. Добре, але аналіз настроїв - це коли ви маєте дуже довгу відповідь, коли ви говорите: "Гей, добре, ну ти знаєш, скажи нам, чому ти дав нам таку відповідь?" А вони, знаєте, використовують речення чи абзаци. Ну, якщо у вас їх сотні чи тисячі, дуже важко комусь пройти їх, прочитати їх усі та зрозуміти, що відбувається, добре?

Отже, існує два різні типи аналізу настроїв. Як правило, раніше ви використовували керований людиною алгоритм навчання. Отже, якщо у вас було 5000 відповідей, пройдіть, знаєте, 200 із них і виберіть позитивні та негативні слова та фрази. Ви по суті будуєте словник позитивних і негативних слів; але, знаєте, це було дуже обмежуючим. Якщо ви робили це для місця, яке займалося ремонтом автомобілів, а потім мали іншого клієнта, знаєте, хто робив чистку килимів, ці два словники абсолютно різні. Вам доведеться робити машинне навчання або навчання під контролем людини знову і знову і знову. Отже, Excel використовує цю річ, яка називається MPQA Subjectivity Lexicon, і ви можете перейти до Google. Він має інформацію про це - 5097 негативних слів, 2533 позитивних слів. І так,він чудово підходить для коротких речень або твітів чи публікацій у Facebook. Але одне, що я помітив, це те, що якщо хтось пише подвійні негативи, я не можу сказати, що я не ненавиджу цю функцію, ну, там машинне навчання не вдасться. І біса, я зазнаю невдачі. Не можу сказати, щасливі вони чи ні.

Гаразд, ось що ми робимо. У Excel 2013 або Excel 2016 перейдіть на вкладку Вставка, перейдіть до Магазину, коли у вікні пошуку з’явиться пошук Azure Machine, і ви отримаєте Azure Machine Learning прямо там. Клацнемо Додати. Гаразд, і тут є два різні інструменти: «Прогнозувальник виживання Титаніка», який приносить задоволення; та, надбудова Excel для аналізу настрою тексту. Давайте використаємо цю. Добре, ось кілька речей, які вас спокусять. Ваш заголовок: Візьміть абзац, щоб пояснити свою відповідь. Він повинен відповідати схемі, і схема говорить, що в заголовку має бути tweet_text. Отже, тут: tweet_text, звичайно, чутливі до регістру справи, добре. А потім закрийте схему, а потім передбачити, введення: від A1 до 100, мої дані мають заголовки, вихідні дані: DataB1, включити заголовки. Вони дадуть нам 2 колонки.Переконайтеся, що у вас є 2 порожні стовпці; в іншому випадку це замінить дані. У вас є 2 варіанти: кілька рядків за раз або як пакет. Це всього лише сотня, тож це насправді не має значення. Я оберу Прогнозувати та БАМ! Просто так швидко.

Гаразд, зараз ми отримуємо 2 стовпці: ми отримуємо Сентімент та Оцінку, добре. Отже, давайте представляти оцінки тут як відсотки з купою десяткових знаків. Гаразд, так 47.496, це від 0 до 100%. Близько до 100 є надзвичайно позитивним, близько 0 є надзвичайно негативним, добре? Отож, у нас є такий, де є незначна проблема, зводить мене з розуму. Не вдається знайти рішення, тому ви можете зрозуміти, чому це оцінено як надзвичайно негативний. Давайте подивимось на такий, який виявляється надзвичайно позитивним. Гаразд, отже, ви знаєте, тож ми маємо тут кілька щасливих слів: будь ласка і дякую, знаки оклику тощо. Це може сприяти високій оцінці. Добре, так це ідеально? Ні, але це дасть вам швидкий, швидкий спосіб сказати, знаєте, скільки людей надзвичайно раді або вкрай негативно ставляться до цих відповідей.

І звичайно, знову ж таки, тут ми можемо зробити це за допомогою зведеної таблиці: Вставити, Зведена таблиця, перейти до наявного робочого аркуша тут, клацнути ОК, і нас цікавить Сентімент, і тоді, можливо, із середнім балом кожен з них. Тож ми змінимо це в розділі Налаштування поля на Середнє, натисніть кнопку ОК. І так, а може, навіть граф. Я думаю, ми хотіли б знати графа, скільки людей. Отже, ми візьмемо інше поле, і отже, ми знаємо, скільки людей було негативно. Ох, скільки людей були нейтральними, скільки людей були позитивними і який середній бал був у кожного з них.

Добре, тому, якщо у вас є дані опитування, і це вибір із декількома варіантами, просто використовувати зведену таблицю, щоб з’ясувати, який відсоток має кожна відповідь. Але для текстових відповідей у ​​вільній формі це важко обробити. Якщо у вас їх сотні чи тисячі, аналіз настроїв - це машинний метод прогнозування позитивної чи негативної відповіді. Microsoft пропонує для цього безкоштовний інструмент. Працює в Excel 2013 або Excel 2016, що називається машинне навчання Azure. Зазвичай доводиться переглядати та класифікувати 5% тверджень вручну вручну. Це не гнучко, вам доведеться перекласифікувати кожен новий набір даних, але Excel використовує цей Лексикон суб’єктивності MPQA. Це загальний словник. Це буде працювати для коротких речень, твітів, публікацій у Facebook. Я можу обдурити подвійними негативами. Тож просто перейдіть до магазину Excel,пошук машинного навчання Azure. Вкажіть вхідні дані та два стовпці для вихідного діапазону. Не забудьте змінити заголовок відповідно до схеми, tweet_text, у цьому конкретному випадку.

Гаразд, отже. Наступного разу, коли у вас буде великий обсяг даних для аналізу, перевірте, скориставшись машинним навчанням Azure, безкоштовною надбудовою для Excel 2013. Дякуємо, що завітали, ми побачимось наступного разу для чергової трансляції від.

Завантажити файл

Завантажте зразок файлу тут: Podcast2062.xlsm

Цікаві статті...