Содержание

Использование пакета анализа — Служба поддержки Office

Двухвыборочный t-тест проверяет равенство средних значений генеральной совокупности по каждой выборке. Три вида этого теста допускают следующие условия: равные дисперсии генерального распределения, дисперсии генеральной совокупности не равны, а также представление двух выборок до и после наблюдения по одному и тому же субъекту.

Для всех трех средств, перечисленных ниже, значение t вычисляется и отображается как «t-статистика» в выводимой таблице. В зависимости от данных это значение t может быть отрицательным или неотрицательным. Если предположить, что средние генеральной совокупности равны, при t < 0 «P(T <= t) одностороннее» дает вероятность того, что наблюдаемое значение t-статистики будет более отрицательным, чем t. При t >=0 «P(T <= t) одностороннее» делает возможным наблюдение значения t-статистики, которое будет более положительным, чем t. «t критическое одностороннее» дает пороговое значение, так что вероятность наблюдения значения t-статистики большего или равного «t критическое одностороннее» равно «Альфа».

«P(T <= t) двустороннее» дает вероятность наблюдения значения t-статистики, по абсолютному значению большего, чем t. «P критическое двустороннее» выдает пороговое значение, так что значение вероятности наблюдения значения t- статистики, по абсолютному значению большего, чем «P критическое двустороннее», равно «Альфа».


Парный двухвыборочный t-тест для средних

Парный тест используется, когда имеется естественная парность наблюдений в выборках, например, когда генеральная совокупность тестируется дважды — до и после эксперимента. Этот инструмент анализа применяется для проверки гипотезы о различии средних для двух выборок данных. В нем не предполагается равенство дисперсий генеральных совокупностей, из которых выбраны данные.


Примечание: Одним из результатов теста является совокупная дисперсия (совокупная мера распределения данных вокруг среднего значения), вычисляемая по следующей формуле:


Двухвыборочный t-тест с одинаковыми дисперсиями

Этот инструмент анализа выполняет t-тест для двух образцов учащихся. В этой форме t-test предполагается, что два набора данных поступили из распределения с одинаковыми дисперсиями. Этот тест называется ом. Этот t-тест можно использовать для определения вероятности того, что эти две выборки взяты из распределения с равными средствами распределения.


Двухвыборочный t-тест с различными дисперсиями

Этот инструмент анализа выполняет t-тест для двух образцов учащихся. В этой форме t-test предполагается, что два набора данных были полученными из распределения с неравными дисперсиями. Его называют гетероскестическими t-тестами. Как и в предыдущем примере с равными дисперсиями, этот t-тест можно использовать для определения вероятности того, что эти две выборки взяты из распределения с равными средствами распределения. Этот тест можно использовать, если в двух примерах есть отдельные объекты. Используйте тест Парный, описанный в примере, если существует один набор тем и два примера представляют измерения для каждой темы до и после обработки.

Для определения тестовой величины t используется следующая формула.

Следующая формула используется для вычисления степеней свободы (df). Так как результат вычисления обычно не является integer, значение df округлится до ближайшего другого, чтобы получить критическое значение из таблицы t. Функция Excel T .Test использует вычисляемую величину df без округлений, так как можно вычислить значение для T.ТЕСТ с неинтегрированной df. Из-за этих разных подходов к определению степеней свободы результаты T.Тест и этот t-тест будут отличаться в случае неравных дисперсий.

Как сделать статистику в excel для чайников?

Функции категории Статистические предназначены в первую очередь для анализа диапазонов ячеек в Excel. С помощью данных функций Вы можете вычислить наибольшее, наименьшее или среднее значение, подсчитать количество ячеек, содержащих заданную информацию, и т.д.

Данная категория содержит более 100 самых различных функций Excel, большая часть из которых предназначена исключительно для статистических расчетов и обычному рядовому пользователю покажется темным лесом. Мы же в рамках этого урока рассмотрим самые полезные и распространенные функции данной категории.

В рамках данной статьи мы не будем затрагивать такие популярные статистические функции Excel, как СЧЕТ и СЧЕТЕСЛИ, для них подготовлен отдельный урок.

СРЗНАЧ()

Статистическая функция СРЗНАЧ возвращает среднее арифметическое своих аргументов.

Данная функция может принимать до 255 аргументов и находить среднее сразу в нескольких несмежных диапазонах и ячейках:

Если в рассчитываемом диапазоне встречаются пустые или содержащие текст ячейки, то они игнорируются. В примере ниже среднее ищется по четырем ячейкам, т.е. (4+15+11+22)/4 = 13

Если необходимо вычислить среднее, учитывая все ячейки диапазона, то можно воспользоваться статистической функцией СРЗНАЧА. В следующем примере среднее ищется уже по 6 ячейкам, т.е. (4+15+11+22)/6 = 8,6(6).

Статистическая функция СРЗНАЧ может использовать в качестве своих аргументов математические операторы и различные функции Excel:

СРЗНАЧЕСЛИ()

Если необходимо вернуть среднее арифметическое значений, которые удовлетворяют определенному условию, то можно воспользоваться статистической функцией СРЗНАЧЕСЛИ. Следующая формула вычисляет среднее чисел, которые больше нуля:

В данном примере для подсчета среднего и проверки условия используется один и тот же диапазон, что не всегда удобно. На этот случай у функции СРЗНАЧЕСЛИ существует третий необязательный аргумент, по которому можно вычислять среднее. Т.е. по первому аргументу проверяем условие, по третьему – находим среднее.

Допустим, в таблице ниже собрана статистика по стоимости лекарств в городе. В одной аптеке лекарство стоит дороже, в другой дешевле. Чтобы посчитать стоимость анальгина в среднем по городу, воспользуемся следующей формулой:

Если требуется соблюсти несколько условий, то всегда можно применить статистическую функцию СРЗНАЧЕСЛИМН, которая позволяет считать среднее арифметическое ячеек, удовлетворяющих двум и более критериям.

МАКС()

Статистическая функция МАКС возвращает наибольшее значение в диапазоне ячеек:

МИН()

Статистическая функция МИН возвращает наименьшее значение в диапазоне ячеек:

НАИБОЛЬШИЙ()

Возвращает n-ое по величине значение из массива числовых данных. Например, на рисунке ниже мы нашли пятое по величине значение из списка.

Чтобы убедиться в этом, можно отсортировать числа в порядке возрастания:

НАИМЕНЬШИЙ()

Возвращает n-ое наименьшее значение из массива числовых данных. Например, на рисунке ниже мы нашли четвертое наименьшее значение из списка.

Если отсортировать числа в порядке возрастания, то все станет гораздо очевидней:

МЕДИАНА()

Статистическая функция МЕДИАНА возвращает медиану из заданного массива числовых данных. Медианой называют число, которое является серединой числового множества. Если в списке нечетное количество значений, то функция возвращает то, что находится ровно по середине. Если же количество значений четное, то функция возвращает среднее для двух чисел.

Например, на рисунке ниже формула возвращает медиану для списка, состоящего из 14 чисел.

Если отсортировать значения в порядке возрастания, то все становится на много понятней:

МОДА()

Возвращает наиболее часто встречающееся значение в массиве числовых данных.

Если отсортировать числа в порядке возрастания, то все становится гораздо понятней:

Статистическая функция МОДА на данный момент устарела, точнее, устарела ее форма записи. Вместо нее теперь используется функция МОДА.ОДН. Форма записи МОДА также поддерживается в Excel для совместимости.

Как известно, категория Статистические в Excel содержит более 100 самых разноплановых функций. Но, как показывает практика, львиная доля этих функций практически не применяется, а особенно начинающими пользователями. В этом уроке мы постарались познакомить Вас только с самыми популярными статистическими функциями Excel, которые Вы рано или поздно сможете применить на практике. Надеюсь, что данный урок был для Вас полезен. Удачи Вам и успехов в изучении Excel.

Оцените качество статьи. Нам важно ваше мнение:

Программа Microsoft Excel удобна для составления таблиц и произведения расчетов. Рабочая область – это множество ячеек, которые можно заполнять данными. Впоследствии – форматировать, использовать для построения графиков, диаграмм, сводных отчетов.

Работа в Экселе с таблицами для начинающих пользователей может на первый взгляд показаться сложной. Она существенно отличается от принципов построения таблиц в Word. Но начнем мы с малого: с создания и форматирования таблицы. И в конце статьи вы уже будете понимать, что лучшего инструмента для создания таблиц, чем Excel не придумаешь.

Как создать таблицу в Excel для чайников

Работа с таблицами в Excel для чайников не терпит спешки. Создать таблицу можно разными способами и для конкретных целей каждый способ обладает своими преимуществами. Поэтому сначала визуально оценим ситуацию.

Посмотрите внимательно на рабочий лист табличного процессора:

Это множество ячеек в столбцах и строках. По сути – таблица. Столбцы обозначены латинскими буквами. Строки – цифрами. Если вывести этот лист на печать, получим чистую страницу. Без всяких границ.

Сначала давайте научимся работать с ячейками, строками и столбцами.

Как выделить столбец и строку

Чтобы выделить весь столбец, щелкаем по его названию (латинской букве) левой кнопкой мыши.

Для выделения строки – по названию строки (по цифре).

Чтобы выделить несколько столбцов или строк, щелкаем левой кнопкой мыши по названию, держим и протаскиваем.

Для выделения столбца с помощью горячих клавиш ставим курсор в любую ячейку нужного столбца – нажимаем Ctrl + пробел. Для выделения строки – Shift + пробел.

Как изменить границы ячеек

Если информация при заполнении таблицы не помещается нужно изменить границы ячеек:

  1. Передвинуть вручную, зацепив границу ячейки левой кнопкой мыши.
  2. Когда длинное слово записано в ячейку, щелкнуть 2 раза по границе столбца / строки. Программа автоматически расширит границы.
  3. Если нужно сохранить ширину столбца, но увеличить высоту строки, воспользуемся кнопкой «Перенос текста» на панели инструментов.

Для изменения ширины столбцов и высоты строк сразу в определенном диапазоне выделяем область, увеличиваем 1 столбец /строку (передвигаем вручную) – автоматически изменится размер всех выделенных столбцов и строк.

Примечание. Чтобы вернуть прежний размер, можно нажать кнопку «Отмена» или комбинацию горячих клавиш CTRL+Z. Но она срабатывает тогда, когда делаешь сразу. Позже – не поможет.

Чтобы вернуть строки в исходные границы, открываем меню инструмента: «Главная»-«Формат» и выбираем «Автоподбор высоты строки»

Для столбцов такой метод не актуален. Нажимаем «Формат» — «Ширина по умолчанию». Запоминаем эту цифру. Выделяем любую ячейку в столбце, границы которого необходимо «вернуть». Снова «Формат» — «Ширина столбца» — вводим заданный программой показатель (как правило это 8,43 — количество символов шрифта Calibri с размером в 11 пунктов). ОК.

Как вставить столбец или строку

Выделяем столбец /строку правее /ниже того места, где нужно вставить новый диапазон. То есть столбец появится слева от выделенной ячейки. А строка – выше.

Нажимаем правой кнопкой мыши – выбираем в выпадающем меню «Вставить» (или жмем комбинацию горячих клавиш CTRL+SHIFT+»=»).

Отмечаем «столбец» и жмем ОК.

Совет. Для быстрой вставки столбца нужно выделить столбец в желаемом месте и нажать CTRL+SHIFT+»=».

Все эти навыки пригодятся при составлении таблицы в программе Excel. Нам придется расширять границы, добавлять строки /столбцы в процессе работы.

Пошаговое создание таблицы с формулами

  1. Заполняем вручную шапку – названия столбцов. Вносим данные – заполняем строки. Сразу применяем на практике полученные знания – расширяем границы столбцов, «подбираем» высоту для строк.
  2. Чтобы заполнить графу «Стоимость», ставим курсор в первую ячейку. Пишем «=». Таким образом, мы сигнализируем программе Excel: здесь будет формула. Выделяем ячейку В2 (с первой ценой). Вводим знак умножения (*). Выделяем ячейку С2 (с количеством). Жмем ВВОД.
  3. Когда мы подведем курсор к ячейке с формулой, в правом нижнем углу сформируется крестик. Он указываем на маркер автозаполнения. Цепляем его левой кнопкой мыши и ведем до конца столбца. Формула скопируется во все ячейки.
  4. Обозначим границы нашей таблицы. Выделяем диапазон с данными. Нажимаем кнопку: «Главная»-«Границы» (на главной странице в меню «Шрифт»). И выбираем «Все границы».

Теперь при печати границы столбцов и строк будут видны.

С помощью меню «Шрифт» можно форматировать данные таблицы Excel, как в программе Word.

Поменяйте, к примеру, размер шрифта, сделайте шапку «жирным». Можно установить текст по центру, назначить переносы и т.д.

Как создать таблицу в Excel: пошаговая инструкция

Простейший способ создания таблиц уже известен. Но в Excel есть более удобный вариант (в плане последующего форматирования, работы с данными).

Сделаем «умную» (динамическую) таблицу:

  1. Переходим на вкладку «Вставка» — инструмент «Таблица» (или нажмите комбинацию горячих клавиш CTRL+T).
  2. В открывшемся диалоговом окне указываем диапазон для данных. Отмечаем, что таблица с подзаголовками. Жмем ОК. Ничего страшного, если сразу не угадаете диапазон. «Умная таблица» подвижная, динамическая.

Примечание. Можно пойти по другому пути – сначала выделить диапазон ячеек, а потом нажать кнопку «Таблица».

Теперь вносите необходимые данные в готовый каркас. Если потребуется дополнительный столбец, ставим курсор в предназначенную для названия ячейку. Вписываем наименование и нажимаем ВВОД. Диапазон автоматически расширится.

Если необходимо увеличить количество строк, зацепляем в нижнем правом углу за маркер автозаполнения и протягиваем вниз.

Как работать с таблицей в Excel

С выходом новых версий программы работа в Эксель с таблицами стала интересней и динамичней. Когда на листе сформирована умная таблица, становится доступным инструмент «Работа с таблицами» — «Конструктор».

Здесь мы можем дать имя таблице, изменить размер.

Доступны различные стили, возможность преобразовать таблицу в обычный диапазон или сводный отчет.

Возможности динамических электронных таблиц MS Excel огромны. Начнем с элементарных навыков ввода данных и автозаполнения:

  1. Выделяем ячейку, щелкнув по ней левой кнопкой мыши. Вводим текстовое /числовое значение. Жмем ВВОД. Если необходимо изменить значение, снова ставим курсор в эту же ячейку и вводим новые данные.
  2. При введении повторяющихся значений Excel будет распознавать их. Достаточно набрать на клавиатуре несколько символов и нажать Enter.
  3. Чтобы применить в умной таблице формулу для всего столбца, достаточно ввести ее в одну первую ячейку этого столбца. Программа скопирует в остальные ячейки автоматически.
  4. Для подсчета итогов выделяем столбец со значениями плюс пустая ячейка для будущего итога и нажимаем кнопку «Сумма» (группа инструментов «Редактирование» на закладке «Главная» или нажмите комбинацию горячих клавиш ALT+»=»).

Если нажать на стрелочку справа каждого подзаголовка шапки, то мы получим доступ к дополнительным инструментам для работы с данными таблицы.

Иногда пользователю приходится работать с огромными таблицами. Чтобы посмотреть итоги, нужно пролистать не одну тысячу строк. Удалить строки – не вариант (данные впоследствии понадобятся). Но можно скрыть. Для этой цели воспользуйтесь числовыми фильтрами (картинка выше). Убираете галочки напротив тех значений, которые должны быть спрятаны.

Если вы никогда раньше не использовали табличный процессор для создания документов, советуем прочитать наше руководство Эксель (Excel) для чайников.

После этого вы сможете создать свой первый табличный лист с таблицами, графиками, математическими формулами и форматированием.

Подробная информация о базовых функциях и возможностях табличного процессора MS Excel.

Описание основных элементов документа и инструкция для работы с ними в нашем материале.

Кстати, чтобы эффективнее работать с таблицами Exel можете ознакомиться с нашим материалом Горячие клавиши Excel — Самые необходимые варианты.

Содержание:

Работа с ячейками. Заполнение и форматирование

Прежде чем приступать к конкретным действиям, необходимо разобраться с базовым элементом любого документа в Excel.

Файл Эксель состоит из одного или нескольких листов, разграфленных на мелкие ячейки.

Ячейка – это базовый компонент любого экселевского отчета, таблицы или графика. В каждой клеточке содержится один блок информации. Это может быть число, дата, денежная сумма, единица измерения или другой формат данных.

Чтобы заполнить ячейку, достаточно просто кликнуть по ней указателем и ввести нужную информацию.

Чтобы отредактировать ранее заполненную ячейку, нажмите на неё двойным кликом мышки.

Рис. 1 – пример заполнения ячеек

Каждая клеточка на листе имеет свой уникальный адрес. Таким образом, с ней можно проводить расчеты или другие операции.

При нажатии на ячейку в верхней части окна появится поле с ее адресом, названием и формулой (если клеточка учуствует в каких-либо расчетах).

Выберем ячейку «Доля акций». Адрес её расположения – А3. Эта информация указана в открывшейся панели свойств. Также мы можем увидеть содержимое.

Формул у этой клетки нет, поэтому они не показываются.

Больше свойств ячейки и функций, которые можно задействовать по отношению к ней, доступны в контекстном меню.

Кликните на клеточку правой клавишей манипулятора.

Откроется меню, с помощью которого можно отформатировать ячейку, провести анализ содержимого, присвоить другое значение и прочие действия.

Рис. 2 – контекстное меню ячейки и ее основные свойства

вернуться к меню ↑ Сортировка данных

Часто пользователи сталкиваются с задачей сортировки данных на листе в Эксель. Эта функция помогает быстро выбрать и просмотреть только нужные данные из всей таблицы.

Перед вами уже заполненная таблица (как её создать разберемся дальше в статье). Представьте, что вам нужно отсортировать данные за январь по возрастанию.

Как бы вы это сделали? Банальное перепечатывание таблицы – это лишняя работа, к тому же, если она объемная, делать этого никто не будет.

Для сортировки в Excel есть специально отведенная функция. От пользователя требуется только:

  • Выделить таблицу или блок информации;
  • Открыть кладку «Данные»;
  • Кликнуть на иконку «Сортировка»;

Рис. 3 – вкладка «Данные»

  • В открывшемся окошке выберите колонку таблицы, над которой будем проводить действия (Январь).
  • Далее тип сортировки (мы выполняем группировку по значению) и, наконец, порядок – по возрастанию.
  • Подтвердите действие, нажав на «ОК».

Рис. 4 – настройка параметров сортировки

Произойдет автоматическая сортировка данных:

Рис. 5 – результат сортировки цифр в столбце «Январь»

Аналогичным образом можно проводить сортировку по цвету, шрифту и другим параметрам.

вернуться к меню ↑ Математические расчеты

Главное преимущество Excel – возможность автоматического проведения расчетов в процессе заполнения таблицы. К примеру, у нас есть две ячейки со значениями 2 и 17. Как в третью ячейку вписать их результат, не делая расчеты самостоятельно?

Для этого, вам необходимо кликнуть на третью ячейку, в которую будет вписан конечный результат вычислений.

Затем нажмите на значок функции f(x), как показано на рисунке ниже.

В открывшемся окошке выберите действие, которое хотите применить. СУММ – это сумма, СРЗНАЧ – среднее значение и так далее.

Полный список функций и их наименований в редакторе Excel можно найти на официальном сайте компании Microsoft.

Нам нужно найти сумму двух ячеек, поэтому нажимаем на «СУММ».

Рис. 6 – выбор функции «СУММ»

В окне аргументов функции есть два поля: «Число 1» и «Число 2». Выберите первое поле и кликните мышкой на ячейку с цифрой «2».

Её адрес запишется в строку аргумента.

Кликните на «Число 2» и нажмите на ячейку с цифрой «17». Затем подтвердите действие и закройте окно.

Если необходимо выполнить математические действия с тремя или большим количеством клеточек, просто продолжайте вводить значения аргументов в поля «Число 3», «Число 4» и так далее.

Если в дальнейшем значение суммируемых ячеек будет изменяться, их сумма будет обновляться автоматически.

Рис. 7 – результат выполнения подсчетов

вернуться к меню ↑ Создание таблиц

В экселевских таблицах можно хранить любые данные.

С помощью функции быстрой настройки и форматирования, в редакторе очень просто организовать систему контроля личного бюджета, список расходов, цифровые данные для отчетности и прочее.

Таблицы в Excel имеют преимущество перед аналогичной опцией в Word и других офисных программах.

Здесь у вас есть возможность создать таблицу любой размерности. Данные заполняются легко. Присутствует панель функций для редактирования содержимого.

К тому же, готовую таблицу можно интегрировать в файл docx с помощью обычной функции копирование-вставка.

Чтобы создать таблицу, следуйте инструкции:

  • Откройте вкладку «Вставка». В левой части панели опций выберите пункт «Таблица». Если вам необходимо провести сведение каких-либо данных, выбирайте пункт «Сводная таблица»;
  • С помощью мышки выделите место на листе, которое будет отведено для таблицы. А также вы можете ввести расположение данных в окно создания элемента;
  • Нажмите ОК, чтобы подтвердить действие.

Рис. 8 – создание стандартной таблицы

Чтобы отформатировать внешний вид получившейся таблички, откройте содержимое конструктора и в поле «Стиль» кликните на понравившийся шаблон.

При желании, можно создать собственный вид с другой цветовой гаммой и выделением ячеек.

Рис. 9 – форматирование таблицы

Результат заполнения таблицы данными:

Рис. 10 – заполненная таблица

Для каждой ячейки таблицы также можно настроить тип данных, форматирование и режим отображения информации. Окно конструктора вмещает в себя все необходимые опции для дальнейшей конфигурации таблички, исходя из ваших требований.

Читайте также:

вернуться к меню ↑ Добавление графиков/диаграмм

Для построения диаграммы или графика требуется наличие уже готовой таблички, ведь графические данные будут основываться именно на информации, взятой из отдельных строк или ячеек.

Чтобы создать диаграмму/график, нужно:

  • Полностью выделить таблицу. Если графический элемент нужно создать только для отображения данных определенных ячеек, выделите только их;
  • Откройте вкладку вставки;
  • В поле рекомендуемых диаграмм выберите иконку, которая, по вашему мнению, наилучшим образом визуально опишет табличную информацию. В нашем случае, это объемная круговая диаграмма. Поднесите к иконке указатель и выберите внешний вид элемента;

Рис. 11 – выбор типа используемой диаграммы

  • Кликните на необходимую форму. На листе автоматически отобразится уже заполненная диаграмма:

Рис. 12 – результат добавление диаграммы

Если нужно изменить внешний вид получившейся визуализации, просто кликните по ней два раза.

Произойдёт автоматическое перенаправление в окно конструктора.

С его помощью можно применить другой стиль к диаграмме, изменить её тип, цветовую гамму, формат отображения данных, добавить новые элементы и провести их настройку.

Аналогичным образом можно создать точечные графики, линейные диаграммы и схемы зависимости элементов таблицы.

Все полученные графические элементы также можно добавить в текстовые документы Ворд.

В табличном редакторе Excel присутствует множество других функций, однако, для начальной работы будет достаточно и приемов, которые описаны в этой статье. В процессе создания документа многие пользователи самостоятельно осваивают более расширенные опции. Это происходит благодаря удобному и понятному интерфейсу последних версий программы.

Читайте также:

Тематические видеоролики:

Эксель (Excel) для чайников: работа с таблицами, графиками, сортировкой данных и математическими расчетами

Проголосовать

Пользуетесь ли вы Excel? Мы выбрали 20 советов, которые помогут вам узнать его получше и оптимизировать свою работу с ним.

Выпустив Excel 2010, Microsoft чуть ли не удвоила функциональность этой программы, добавив множество улучшений и нововведений, многие из которых не сразу заметны. Неважно, опытный вы пользователь или новичок, найдется немало способов упростить работу с Excel. О некоторых из них мы сегодня расскажем.

Выделение всех ячеек одним кликом

Все ячейки можно выделить комбинацией клавиш Ctrl + A, которая, кстати, работает и во всех других программах. Однако есть более простой способ выделения. Нажав на кнопку в углу листа Excel, вы выделите все ячейки одним кликом.

Открытие нескольких файлов одновременно

Вместо того чтобы открывать каждый файл Excel по отдельности, их можно открыть вместе. Для этого выделите файлы, которые нужно открыть, и нажмите Enter.

Перемещение по файлам Excel

Когда у вас открыто несколько книг в Excel, между ними можно легко перемещаться с помощью комбинации клавиш Ctrl + Tab. Эта функция также доступна по всей системе Windows, и ее можно использовать во многих приложениях. К примеру, для переключения вкладок в браузере.

Добавление новых кнопок на панель быстрого доступа

Стандартно в панели быстрого доступа Excel находятся 3 кнопки. Вы можете изменить это количество и добавить те, которые нужны именно вам.

Перейдите в меню «Файл» ⇒ «Параметры» ⇒ «Панель быстрого доступа». Теперь можно выбрать любые кнопки, которые вам нужны.

Диагональная линия в ячейках

Иногда бывают ситуации, когда нужно добавить в таблицу диагональную линию. К примеру, чтобы разделить дату и время. Для этого на главной странице Excel нажмите на привычную иконку границ и выберите «Другие границы».

Добавление в таблицу пустых строк или столбцов

Вставить одну строку или столбец достаточно просто. Но что делать, если их нужно вставить гораздо больше? Выделите нужное количество строк или столбцов и нажмите «Вставить». После этого выберите место, куда нужно сдвинуться ячейкам, и вы получите нужное количество пустых строк.

Скоростное копирование и перемещение информации

Если вам нужно переместить любую информацию (ячейку, строку, столбец) в Excel, выделите ее и наведите мышку на границу, чтобы изменился указатель. После этого переместите информацию в то место, которое вам нужно. Если необходимо скопировать информацию, сделайте то же самое, но с зажатой клавишей Ctrl.

Быстрое удаление пустых ячеек

Пустые ячейки — это бич Excel. Иногда они появляются просто из ниоткуда. Чтобы избавиться от них всех за один раз, выделите нужный столбец, перейдите на вкладку «Данные» и нажмите «Фильтр». Над каждым столбцом появится стрелка, направленная вниз. Нажав на нее, вы попадете в меню, которое поможет избавиться от пустых полей.

Расширенный поиск

Нажав Ctrl + F, мы попадаем в меню поиска, с помощью которого можно искать любые данные в Excel. Однако его функциональность можно расширить, используя символы «?» и «*». Знак вопроса отвечает за один неизвестный символ, а астериск — за несколько. Их стоит использовать, если вы не уверены, как выглядит искомый запрос.

Если же вам нужно найти вопросительный знак или астериск и вы не хотите, чтобы вместо них Excel искал неизвестный символ, то поставьте перед ними «~».

Копирование уникальных записей

Уникальные записи могут быть полезными, если вам нужно выделить в таблице неповторяющуюся информацию. К примеру, по одному человеку каждого возраста. Для этого выберите нужный столбец и нажмите «Дополнительно» слева от пункта «Фильтр». Выберите исходный диапазон (откуда копировать) и диапазон, в который нужно поместить результат. Не забудьте поставить галочку.

Создание выборки

Если вы делаете опрос, в котором могут участвовать только мужчины от 19 до 60, вы легко можете создать подобную выборку с помощью Excel. Перейдите в пункт меню «Данные» ⇒ «Проверка данных» и выберите необходимый диапазон или другое условие. Вводя информацию, которая не подходит под это условие, пользователи будут получать сообщение, что информация неверна.

Быстрая навигация с помощью Ctrl и стрелки

Нажимая Ctrl + стрелка, можно перемещаться в крайние точки листа. К примеру, Ctrl + ⇓ перенесет курсор в нижнюю часть листа.

Транспонирование информации из столбца в строку

Довольно полезная функция, которая нужна не так уж и часто. Но если она вдруг понадобится, вряд ли вы будете транспонировать по одной. Для транспонирования в Excel есть специальная вставка.

Скопируйте диапазон ячеек, который нужно транспонировать. После этого кликните правой кнопкой на нужное место и выберите специальную вставку.

Как скрывать информацию в Excel

Не знаю, зачем это может пригодиться, но тем не менее такая функция в Excel есть. Выделите нужный диапазон ячеек, нажмите «Формат» ⇒ «Скрыть или отобразить» и выберите нужное действие.

Объединение текста с помощью «&»

Если вам нужно объединить текст из нескольких ячеек в одну, необязательно использовать сложные формулы. Достаточно выбрать ячейку, в которой будет соединен текст, нажать «=» и последовательно выбрать ячейки, ставя перед каждой символ «&».

Изменение регистра букв

С помощью определенных формул можно менять регистр всей текстовой информации в Excel. Функция «ПРОПИСН» делает все буквы прописными, а «СТРОЧН» — строчными. «ПРОПНАЧ» делает прописной только первую букву в каждом слове.

Внесение информации с нулями в начале

Если вы введете в Excel число 000356, то программа автоматически превратит его в 356. Если вы хотите оставить нули в начале, поставьте перед числом апостроф «’».

Ускорение ввода сложных слов

Если вы часто вводите одни и те же слова, то обрадуетесь, узнав, что в Excel есть автозамена. Она очень похожа на автозамену в смартфонах, поэтому вы сразу поймете, как ей пользоваться. С ее помощью можно заменить повторяющиеся конструкции аббревиатурами. К примеру, Екатерина Петрова — ЕП.

Больше информации

В правом нижнем углу можно следить за различной информацией. Однако мало кто знает, что, нажав туда правой кнопкой мыши, можно убрать ненужные и добавить нужные строки.

Переименование листа с помощью двойного клика

Это самый простой способ переименовать лист. Просто кликните по нему два раза левой кнопкой мыши и введите новое название.

Часто ли вы пользуетесь Excel? Если да, то у вас наверняка есть свои секреты работы с этой программой. Делитесь ими в комментариях.

4 техники анализа данных в Microsoft Excel

Юлия Перминова

1. Сводные таблицы

Базовый инструмент для работы с огромным количеством неструктурированных данных, из которых можно быстро сделать выводы и не возиться с фильтрацией и сортировкой вручную. Сводные таблицы можно создать с помощью нескольких действий и быстро настроить в зависимости от того, как именно вы хотите отобразить результаты.

Полезное дополнение. Вы также можете создавать сводные диаграммы на основе сводных таблиц, которые будут автоматически обновляться при их изменении. Это полезно, если вам, например, нужно регулярно создавать отчёты по одним и тем же параметрам.

Как работать

Исходные данные могут быть любыми: данные по продажам, отгрузкам, доставкам и так далее.

  1. Откройте файл с таблицей, данные которой надо проанализировать.
  2. Выделите диапазон данных для анализа.
  3. Перейдите на вкладку «Вставка» → «Таблица» → «Сводная таблица» (для macOS на вкладке «Данные» в группе «Анализ»).
  4. Должно появиться диалоговое окно «Создание сводной таблицы».
  5. Настройте отображение данных, которые есть у вас в таблице.

Перед нами таблица с неструктурированными данными. Мы можем их систематизировать и настроить отображение тех данных, которые есть у нас в таблице. «Сумму заказов» отправляем в «Значения», а «Продавцов», «Дату продажи» — в «Строки». По данным разных продавцов за разные годы тут же посчитались суммы. При необходимости можно развернуть каждый год, квартал или месяц — получим более детальную информацию за конкретный период.

Набор опций будет зависеть от количества столбцов. Например, у нас пять столбцов. Их нужно просто правильно расположить и выбрать, что мы хотим показать. Скажем, сумму.

Можно её детализировать, например, по странам. Переносим «Страны».

Можно посмотреть результаты по продавцам. Меняем «Страну» на «Продавцов». По продавцам результаты будут такие.

2. 3D-карты

Этот способ визуализации данных с географической привязкой позволяет анализировать данные, находить закономерности, имеющие региональное происхождение.

Полезное дополнение. Координаты нигде прописывать не нужно — достаточно лишь корректно указать географическое название в таблице.

Как работать

  1. Откройте файл с таблицей, данные которой нужно визуализировать. Например, с информацией по разным городам и странам.
  2. Подготовьте данные для отображения на карте: «Главная» → «Форматировать как таблицу».
  3. Выделите диапазон данных для анализа.
  4. На вкладке «Вставка» есть кнопка 3D-карта.

Точки на карте — это наши города. Но просто города нам не очень интересны — интересно увидеть информацию, привязанную к этим городам. Например, суммы, которые можно отобразить через высоту столбика. При наведении курсора на столбик показывается сумма.

Также достаточно информативной является круговая диаграмма по годам. Размер круга задаётся суммой.

3. Лист прогнозов

Зачастую в бизнес-процессах наблюдаются сезонные закономерности, которые необходимо учитывать при планировании. Лист прогноза — наиболее точный инструмент для прогнозирования в Excel, чем все функции, которые были до этого и есть сейчас. Его можно использовать для планирования деятельности коммерческих, финансовых, маркетинговых и других служб.

Полезное дополнение. Для расчёта прогноза потребуются данные за более ранние периоды. Точность прогнозирования зависит от количества данных по периодам — лучше не меньше, чем за год. Вам требуются одинаковые интервалы между точками данных (например, месяц или равное количество дней).

Как работать

  1. Откройте таблицу с данными за период и соответствующими ему показателями, например, от года.
  2. Выделите два ряда данных.
  3. На вкладке «Данные» в группе нажмите кнопку «Лист прогноза».
  4. В окне «Создание листа прогноза» выберите график или гистограмму для визуального представления прогноза.
  5. Выберите дату окончания прогноза.

В примере ниже у нас есть данные за 2011, 2012 и 2013 годы. Важно указывать не числа, а именно временные периоды (то есть не 5 марта 2013 года, а март 2013-го).

Для прогноза на 2014 год вам потребуются два ряда данных: даты и соответствующие им значения показателей. Выделяем оба ряда данных.

На вкладке «Данные» в группе «Прогноз» нажимаем на «Лист прогноза». В появившемся окне «Создание листа прогноза» выбираем формат представления прогноза — график или гистограмму. В поле «Завершение прогноза» выбираем дату окончания, а затем нажимаем кнопку «Создать». Оранжевая линия — это и есть прогноз.

4. Быстрый анализ

Эта функциональность, пожалуй, первый шаг к тому, что можно назвать бизнес-анализом. Приятно, что эта функциональность реализована наиболее дружественным по отношению к пользователю способом: желаемый результат достигается буквально в несколько кликов. Ничего не нужно считать, не надо записывать никаких формул. Достаточно выделить нужный диапазон и выбрать, какой результат вы хотите получить.

Полезное дополнение. Мгновенно можно создавать различные типы диаграмм или спарклайны (микрографики прямо в ячейке).

Как работать

  1. Откройте таблицу с данными для анализа.
  2. Выделите нужный для анализа диапазон.
  3. При выделении диапазона внизу всегда появляется кнопка «Быстрый анализ». Она сразу предлагает совершить с данными несколько возможных действий. Например, найти итоги. Мы можем узнать суммы, они проставляются внизу.

В быстром анализе также есть несколько вариантов форматирования. Посмотреть, какие значения больше, а какие меньше, можно в самих ячейках гистограммы.

Также можно проставить в ячейках разноцветные значки: зелёные — наибольшие значения, красные — наименьшие.

Надеемся, что эти приёмы помогут ускорить работу с анализом данных в Microsoft Excel и быстрее покорить вершины этого сложного, но такого полезного с точки зрения работы с цифрами приложения.

Читайте также:

Статистика Excel для SEO и анализа данных

Команда SEOnews

Сегодня практически каждый понимает, что нет таких данных, которые было бы невозможно получить. Чтобы получить данные по сайту, используются бесплатные инструменты или тратятся огромные суммы денег на платные инструменты, чтобы получить еще больше информации. Неважно какую информацию вы ищите, вы точно ее найдете и вопрос лишь в том — бесплатно или за деньги.

У всех инструментов есть кое-что общее — это кнопка «Экспорт». Возможно, это самое важное свойство всех инструментов. Сэкспортировав данные в Excel, специалист может сортировать и фильтровать их так, как ему нужно. Большинство из нас регулярно пользуется Excel, но только его стандартными функциями. Однако Excel может гораздо больше!

Виргил Гик (Virgil Ghic) рассказал о наиболее распространенных приемах обработки статистических данных. И самое главное — вам не придется их запоминать, все они встроены в Excel.

Статистика — это сбор, анализ и интерпретация данных. Она помогает в тех ситуациях, когда принятию решения мешает некоторая неопределенность. Используя статистику, мы избежим неопределенность и получим действенный анализ.

В статистике можно выделить два главных направления: описательная статистика и логически выведенная статистика.

Описательная (дескриптивная) статистика используется в том случае, когда вам известны все значения в наборе данных. Например, вы задаете 1000 респондентов вопрос, любят ли они апельсины, и предоставляете им два варианта ответа: Да и Нет. Затем собираете данные и выясняете, что 900 человек ответили Да и 100 — Нет. Пропорция будет следующей: 90% составил ответ Да и 10% — ответ Нет. Достаточно легко, не правда ли?

Но как быть в том случае, когда у нас нет всех данных?

В случае когда у вас только часть данных на помощь придет логически выведенная статистика. Она используется тогда, когда вы знаете только небольшую часть всех данных и вам необходимо сделать предположение о всем объеме данных.

Давайте предположим, что вы хотите рассчитать количество просмотров email за последние два года, но вы располагаете данными только за последние шесть месяцев. Предположим, что из 1000 email-адресов письма открыли только 200 получателей, значит остальные 800 — не открывали. Следовательно мы имеем соотношение 20% открывших к 80% неоткрывших. Эти данные верны для периода в шесть месяцев, но они также могут быть верны и для периода в два года. Логически выведенная статистика поможет нам понять, насколько верно наше предположение.

Доля открытых писем может составлять 20%, а может немного отличаться. Допустим, она варьируется /-3%, тогда доля открытых писем будет составлять от 17% до 23%. Но насколько мы уверены в этих данных? Кроме того, какой процент случайной выборки из всего набора данных будет находиться в диапазоне от 17% −23%?

В статистике считается приемлемым уровень достоверности в 95%. Это означает, что 95% выборочных данных, взятых из всего набора данных, будет соответствовать 17-23%, оставшиеся 5% будут либо выше 23%, либо ниже 17%. Но мы уверены в том, что для 95% доля открытых писем составляет 20% /- 3%.

Термин данные (data) предполагает любую величину, обозначающую объект или событие, например, посетители, исследования, письма.

Термин набор данных (data set) состоит из двух компонентов: Единица наблюдения (observation unit) может означать посетителей и переменные, представляющие демографические данные ваших посетителей (возраст, зарплата, образование). Совокупность (population) предполагает каждого члена вашей группы, а в веб-аналитике — всех посетителей. Предположим, посетителей 10 000.

Выборка (sample) — часть вашей совокупности, представленная на основе определенной даты или сконвертированных посетителей и т.д. В статистике наиболее ценной является случайная выборка (random sample).

Распределение данных (data distribution) определяется частотой, согласно которой представлены значения в наборе данных. Представив частоту на графике с диапазоном значений на горизонтальной оси и частотой по вертикальной оси, мы получим кривую распределения. Наиболее распространенным является нормальное распределение или колоколообразная кривая.

Самый простой способ понять это — представить на количестве посетителей веб-сайта. Например, в среднем ежедневное количество посещений сайта составляет 2000, иногда бывает больше — 3000 посещений или меньше — 1000.

Здесь пригодится теория вероятности (probability theory).

Вероятность означает вероятность события, которое происходит, например, при наличии 3000 посетителей в день и выражается в процентах.

Самым распространенным примером вероятности, известным многим, является подбрасывание монеты. У монеты две стороны: орел и решка. Какова вероятность того, что монета ляжет той или другой стороной? Существует две возможности, таким образом 100%/2=50%

Достаточно теории, перейдет к практике.

Excel — прекрасный инструмент, который поможет нам в работе со статистикой. Отметим, что это не лучший инструмент, но зато все знают, как им пользоваться, поэтому рассмотрим именно Excel.

Во-первых, установите надсройку Analysis ToolPack.

Откройте Excel, перейдите в Опции -> Add-ins->внизу списка вы найдёте

Нажимайте Go ->выберите Analysis ToolPack->и нажимайте OK.

Теперь в панеле выберите опцию Данные и найдите там Анализ данных.

Инструмент Анализ данных может предоставить вам невероятную статистическую информацию, но давайте начнем с чего-нибудь попроще.

Среднее, Медиана и Мода

Среднее (mean) это статистическое значение среднего значения, например, средним для 4,5,6 будет 5. Как рассчитать среднее значение в Excel? =average(число1,число2 и т.д.)

Mean=AVERAGE(AC16:AC21)

Путем вычисления среднего мы определяем, сколько мы продали в среднем. Эта информация полезна, если нет экстремальных значений (или выбросов). Почему?

Например, мы продали в среднем товаров на $3000, но на самом деле нам повезло, т.к. 6 сентября покупатели потратили больше. В предыдущие шесть дней товара было куплено в среднем лишь на $618. Исключив крайние значения от среднего, можно получить более репрезентативные даные.

Медиана (median) это значение, которое делит набор данных на две равные части. Например, для набора данных 224, 298, 304 медианой является — 298. Для того чтобы вычислить среднее для большого набора данных, можно использовать следующую формулу =MEDIAN(224,298,304).

Когда может пригодиться медиана? Медиана полезна, когда у вас есть неравномерное распределение, например, цена ваших конфет варьируется от $3 до $15 за упаковку, но также у вас есть очень дорогие конфеты за $100, которые покупают редко. В конце месяца вы делаете отчет, и вы видите, что вы продали в основном дешевые конфеты и только пару упаковок за $100. В этом случае вам будет полезен расчет медианы.

Самый простой способ понять, когда лучше использовать медиану и среднее, это построение гистограммы. Если ваша гистограмма сильно смещена до экстримальных значений, значит нужно рассчитывать медиану.

Мода (mode) самое распространенное значение, например, мода для: 4,6,7,7,7,7,9,10 это 7.

Рассчитать моду в Excel вы можете с помощью формулы =MODE(4,6,7,7,7,7,9,10).

Но имейте в виду, что Excel выдает за моду наименьшее значение из возможных. Например, вы рассчитываете моду для следующего набора данных: 2,2,2,4,5,6,7,7,7,8,9, сразу отметим, что здесь две моды — 2 и 7, но Excel покажет вам только наименьшее значение — 2.

Когда можно использовать функцию моды? Расчет моды полезен только для целых чисел, например 1, 2 и 3. И нежелателен для дробных чисел, таких как 1,744; 2,443; 3,323, т.к. числа могут дублироваться.

Гистограммы

Предположим, недавно в вашем блоге была опубликована сотня гостевых постов, некоторые из них хорошего качества, другие не очень. Возможно, вы захотели узнать, какие из постов получили по 10, 20, 30 обратных ссылок или вам интересны твиты, лайки, расшаривания, а может и просто посещения.

Мы разделили все это на группы с помощью графического представления данных под названием гистограмма. Виргил Гик (Virgil Ghic) приводит пример с посещениями и постами, как один из менее сложных. Он настроил свой аккаунт в Google Analytics следующим образом: у него есть профиль, в который собирается статистика только по его блогу, ничего больше. Если у вас нет такого же профиля, тогда вы можете использовать сегменты.

Это несложно.

Далее идем в экспорт ->CSV

Открываем Excel и создаем два столбца: Целевая страница и Посещения. Также создаем список, в соответствии с которым будем категоризировать данные. В данном случае мы определяем, сколько статей имеют 100, 300, 500 и т.д. посещений.

Данные -> Анализ данных->Гистограммы->OK

  • Входной интервал (input range) будет столбец с посещениями.

  • Интервал карманов (bin range) — это группы.

  • Выходной интервал (output range), кликните на ячейку, где вы хотите создать гистограмму.

  • Проверьте график выхода (chart output).

  • Нажимаем OK.

Вы получили гистограмму, которая отражает количество статей, сгруппированных по посещениям. Чтобы лучше разобраться в гистограмме, нужно кликнуть на любую ячейку в столбцах Bin и Frequency и отфильтровать частоту от меньшего к большему.

Анализировать данные теперь еще проще. Возвращаемся и фильтруем все статьи от меньшего или равного 100 посещениям (Визиты, выпадающее меню->Числовые фильтры->Между…0-100->Ok) в прошлом месяце и обновляем.

Источники посещений

Насколько значим данный отчет для вас?

Он достаточно хорош, но не более того. Мы можем проанализировать рост и снижение посещений, но … какова доля посещений с YouTube в общей статистике посещений за февраль? Конечно, можно разбираться, но это дополнительная работа, и это очень неудобно, когда этот вопрос вам задает клиент по телефону. Чтобы ваши графики были максимально полезны, создавайте описательные отчеты.

В вышеупомянутом отчете просто разобраться, сложнее его создать. Но зато он вам очень пригодится.

Что мы видим в мае: доля переходов с Facebook в общей статистике посещений больше обычного. Почему? Возможно, в мае рекламная кампания оказалась более эффективной, чем в другие месяцы, это и привело к росту трафика с Facebook. Если дело в рекламной кампании, давайте повторим ее.

Однако правильней будет провести хи-квадрат тест (Chi-Square Test), который позволит нам понять была ли это счастливая случайность или эффективная маркетинговая кампания.

Фактический столбец — количество посещений, Ожидаемый столбец — среднее из «фактического» столбца. Формула хи-квадрат теста следующая: =1-CHITEST(N10:N16,O10:O16), где N10:N16 — это значения из Актуального столбца, а O10:O16 — значения из Ожидаемого.

Результат в 100% является уровнем достоверности, свидетельствующий о вероятности того, что рост посещений с Facebook является результатом маркетинговых кампаний.

Создавая метрики, помните, они должны быть максимально понятными и релевантными вашей бизнес-модели.

В данном видео вы найдете еще один пример использования хи-квадрат теста.

Скользящее среднее (moving average) и линейная регрессия (linear regression) для прогнозирования

Мы часто встречаем такие графики, как расположенный выше. На них могут быть представлены продажи, посещения и т.д. И они всегда выглядят именно так: прямая, идущая вверх-вниз. В такой картине данных присутствует много шума, который мы хотим сгладить для лучшего понимания данных.

Решением является скользящее среднее! Данный метод обычно используется трейдерами для прогнозирования цен акций, которые сегодня могут взлететь вверх, а уже завтра обвалиться.

Давайте разберемся, как мы можем использовать данный метод.

Шаг 1:

Экспортируйте в Excel число посещений/продаж за долгий период времени, например, один-два года.

Шаг 2:

Данные-> Анализ данных -> Скользящее среднее ->OK

Входной интервал — это столбец с числом посещений.

Интервал — это количество дней для которых вычисляется среднее. Вам нужно создать одно скользящее среднее с большим числом, например, 30 и одно с меньшим числом, например, 7.

Выходной интервал — это столбец справа от столбца посещений.

Повторите данные шаги для интервала в 7 дней.

Теперь ваши данные выглядят примерно так:

Если вы выберете все столбцы и построите линейный график, вы получите следующее:

В таком представлении данных меньше шума, их легче анализировать и можно увидеть некоторые тренды. Зеленая линия визуально немного облегчает график, но она реагирует на почти каждое крупное событие. Тогда как красная линия является более стабильной, она отражает реальный тренд.

В конце линейного графика вы увидите такие значения, как Прогноз. Это прогнозируемые данные, выведенные на основе предыдущих трендов.

В Excel есть два способа создать линейную регрессию, используя формулу =FORECAST(x,known_y’s, known_x’s), где «означает дату, для которой вы создаете прогноз; «known_y’s» — это столбец посещений, «known_x’s» — столбец с датами. Данный метод не так уж сложен, но есть более простой способ сделать то же самое.

Выделив весь столбец посещений и потянув вниз за край, автоматически сгенерируется прогноз на следующие даты.

Убедитесь в том, что вы выбрали весь набор данных для того, чтобы результат был точный.

Существует теория при сравнении скользящего среднего для 7дней и 30дней. Как было сказано выше линия 7дней реагирует практически на все основные изменения, в то время как линии 30дней требуется больше времени, чтобы изменить свое направление. Как правило, когда скользящее среднее 7дней пересекает скользящее среднее 30дней, вы можете рассчитывать на существенное изменение, которое будет длиться дольше, чем день или два. Как можно увидеть выше, 6 апреля скользящее среднее 7дней пересекает скользящее среднее 30дней, число посещений снижается, у 6 июня линии снова пересекаются и тренды идут вверх. Этот метод полезен, когда вы теряете трафик и не уверены, тренд ли это или всего лишь суточные колебания.2 = 0,26 означает, что наша модель объясняет 26% вариаций. Проще говоря, мы уверены на 26%, что ежедневно количество посетителей увеличивается на одного.

Сезонное прогнозирование

Предположим, скоро Рождество. Прогнозирование на зимний сезон будет весьма полезно, особенно когда с этим периодом вы связываете большие надежды.

Если вы не попали под Google-фильтры Panda или Penguin и ваши продажи/посетители соответствуют сезонным тенденциям, вы можете спрогнозировать характер продаж или посещений.

Сезонное прогнозирование — это метод, который позволяем нам оценить будущие значения набора данных на основе сезонных колебаний. Сезонные наборы данных есть везде, например, магазин мороженого будет очень востребован во время летнего сезона, а сувенирный магазин может достичь максимальных продаж во время зимних праздников.

Прогнозирование данных на ближайшее будущее может быть очень полезно, особенно когда мы планируем вкладывать деньги в маркетинговые кампании для таких сезонов.

Следующий пример представляет собой базовую модель, но она может быть расширена до более сложных, чтобы отвечать вашей бизнес-модели.

Загрузите Пример прогнозирования в Excel

Для удобства восприятия я разобью весь процесс на этапы. Вам нужно загрузить таблицу Excel и выполнить следующие шаги:

  • Экспортируйте ваши данные; чем больше данных, тем более точным будет прогноз! Укажите даты в столбце А, а продажи в столбце В.

  • Рассчитайте индекс для каждого месяца и добавьте полученные данные в столбец С.

Для расчета индекса прокрутите вниз, справа вы найдете таблицу под названием Индекс (Index). Индекс за январь 2009 рассчитывается путем деления продаж за январь 2009 г. на среднее значение продаж за весь 2009 год.

Таким же образом рассчитайте индекс для каждого месяца каждого года.

В столбце S с 38 по 51 строки мы рассчитали средний индекс для каждого месяца.

Т.к. сезонность повторяется каждые 12 месяцев, мы скопировали значения индекса в столбец C, т.к. они остаются актуальными. Вы можете заметить, что индекс января 2009 такой же как и в январе 2010 и 2011 годов.

  • В столбце D рассчитайте Скорректированные данные (Adjusted data) путем деления ежемесячных продаж на индекс =B10/C10.

  • Выберите значения из столбцов A, B и D и постройте линейный график.

  • Выберите скорректированную линию (в моем случае это красная линия) и добавьте линейный тренд, проверьте окошко «Показать уравнение на графике».

  • Рассчитайте несезонные значения для прошлого периода путем умножения ежемесячных продаж на коэффициент из уравнения линии тренда и добавьте константу из уравнения (столбец Е).

После создания линии тренда и представления Уравнения на графике, мы принимаем во внимание Коэффициент — число, которое умножается на X, и константу — число, которое, как правило, является отрицательным.2).

В моих ячейках F50 и F51 представлены спрогнизованные данные для ноября 2012 и декабря 2012. Ячейка H52 демонстрирует погрешность.

С помощью данного метода мы можем определить, что в декабре 2012 мы заработаем $22,022 ± 3.11%. Теперь идем к боссу и рассказываем о своих предположениях.

Стандартное отклонение

Стандартное отклонение (standard deviation) говорит о том, насколько наши значения отклоняться от среднего значения, мы можем назвать его уровнем доверия. Например, у вас есть данные по продажам за месяц и данные по ежедневным продажам, причем каждый день объем продаж разный. Вы можете использовать стандартное отклонение чтобы рассчитать, насколько вы отклонились от среднемесячного показателя.

Вот две формулы Стандартного отклонения в Excel, которые вы можете использовать

=stdev — когда у вас есть выборочные данные -> Авинаш Кошик подробно рассказывает, как работает выборка

или

=stdevp — когда у вас полная совокупность данных, т.е. когда вы анализируете каждого посетителя. Я предпочитаю именно =stdev, потому что бывают случаи, когда код отслеживания JS не работает.

Давайте посмотрим, как мы можем применить стандартное отклонение в нашей повседневной жизни.

Используя стандартное отклонение в Excel, данные можно представить более наглядным и понятным образом. Как вы видеть на графике выше, средняя ежедневная посещаемость равна 501 со стандартным отклонением 53. Но самое главное на таком графике вы видите, где вы превысили свои обычные показатели. Это позволит выделить те маркетинговые кампании, которые привели к такому всплеску, и применить/проверить их еще раз.

Для работы используйте данную ссылку: http://blog.instantcognition.com/wp-content/uploads/2007/01/controllimits_final.xls

Корреляция

Корреляция — это статистическая взаимосвязь двух или нескольких (случайных) переменных. Типичным примером корреляции в веб-аналитики может быть количество посетителей и количество продаж. Чем больше у вас целевых посетителей, тем больше будет продаж. У доктора Пита (Dr Pete) есть хорошая инфографика, посвященная корреляции vs. причинности.

В Excel мы используем следующую формулу для определения корреляции:

=correl(x,y)

Как вы видит на картинке выше, корреляция между Посещениями и Продажами равна 0.1. Что это значит?

  • от 0 до 0,3 считается слабой корреляцией

  • от 0.3 до 0,7 — нормальная

  • более 0,7 — сильная

Заключение следующее: ежедневные посещения не влияют на ежедневные продажи, что также означает, что посетители, которых вы привлекли, не являются целевыми. При принятии решения полагайтесь на ваше деловое чутье, но не игнорируйте корреляцию в 0,1.

Если вы хотите определить корреляцию между тремя и более переменными, используйте функцию корреляции в разделе Анализ данных.

Данные->Анализ данных->Корреляция

Ваш результат будет похож на один из этих:

Здесь мы видим, что ни один из элементов не коррелируют друг с другом:

  • Продажи и посетители = корреляция 0,1.

  • Продажи и расшаривания = корреляция 0,23.

  • Описательная статистика для быстрого анализа.

Теперь у вас есть довольно хорошее представление о среднем, стандартных отклонениях и т.д., но расчет каждого статистического элемента требует дополнительного времени. В разделе Анализ данных вы найдете краткий обзор наиболее распространенных элементов.

  • Данные->Анализ данных-> Описательная статистика.

  • Входной интервал — выбираем данные для анализа.

  • Выходной интервал — выбираем ячейку, где отобразится таблица.

  • Проверяем Сводную статистику.

Достаточно хороший результат:

Нам осталось разобраться с тем, что такое Эксцесс (kurtosis) и Асимметрия (skewness).

Эксцесс — это мера остроты пика распределения случайной величины, как далеко пик кривой находится от среднего значения. Чем выше значение эксцесса, тем острее пики по бокам. В нашем случае эксцесс является очень низким, это означает, что значения распределены равномерно.

Асимметрия показывает, насколько искажены ваши данные — негативно или позитивно, по сравнению с нормальным распределением. Теперь представим асимметрию более наглядно:

Асимметрия: −0.28 (распределение, скорее всего, ориентировано на более высоких значений 2500 и 3000).

Эксцесс: −0.47 (небольшое пиковое отклонение от центра).

Все эти методы можно использовать при анализе данных. Самой большой сложностью со статистическими данными и Excel является возможность применения этих методов в самых различных ситуациях, не ограничиваясь посещениями или продажами. Отличный пример использования нескольких статистических подходов представил Том Энтони в своем посте об инструменте для определения ссылочного профиля (Link Profile Tool).

Приведенные выше примеры являются лишь малой частью того, что можно сделать с помощью статистики и Excel. Если вы используете другие методы, поделитесь ими в комментариях.

Статистические функции Excel, которые необходимо знать

Функции категории Статистические предназначены в первую очередь для анализа диапазонов ячеек в Excel. С помощью данных функций Вы можете вычислить наибольшее, наименьшее или среднее значение, подсчитать количество ячеек, содержащих заданную информацию, и т.д.

Данная категория содержит более 100 самых различных функций Excel, большая часть из которых предназначена исключительно для статистических расчетов и обычному рядовому пользователю покажется темным лесом. Мы же в рамках этого урока рассмотрим самые полезные и распространенные функции данной категории.

В рамках данной статьи мы не будем затрагивать такие популярные статистические функции Excel, как СЧЕТ и СЧЕТЕСЛИ, для них подготовлен отдельный урок.

СРЗНАЧ()

Статистическая функция СРЗНАЧ возвращает среднее арифметическое своих аргументов.

Данная функция может принимать до 255 аргументов и находить среднее сразу в нескольких несмежных диапазонах и ячейках:

Если в рассчитываемом диапазоне встречаются пустые или содержащие текст ячейки, то они игнорируются. В примере ниже среднее ищется по четырем ячейкам, т.е. (4+15+11+22)/4 = 13

Если необходимо вычислить среднее, учитывая все ячейки диапазона, то можно воспользоваться статистической функцией СРЗНАЧА. В следующем примере среднее ищется уже по 6 ячейкам, т.е. (4+15+11+22)/6 = 8,6(6).

Статистическая функция СРЗНАЧ может использовать в качестве своих аргументов математические операторы и различные функции Excel:

СРЗНАЧЕСЛИ()

Если необходимо вернуть среднее арифметическое значений, которые удовлетворяют определенному условию, то можно воспользоваться статистической функцией СРЗНАЧЕСЛИ. Следующая формула вычисляет среднее чисел, которые больше нуля:

В данном примере для подсчета среднего и проверки условия используется один и тот же диапазон, что не всегда удобно. На этот случай у функции СРЗНАЧЕСЛИ существует третий необязательный аргумент, по которому можно вычислять среднее. Т.е. по первому аргументу проверяем условие, по третьему – находим среднее.

Допустим, в таблице ниже собрана статистика по стоимости лекарств в городе. В одной аптеке лекарство стоит дороже, в другой дешевле. Чтобы посчитать стоимость анальгина в среднем по городу, воспользуемся следующей формулой:

Если требуется соблюсти несколько условий, то всегда можно применить статистическую функцию СРЗНАЧЕСЛИМН, которая позволяет считать среднее арифметическое ячеек, удовлетворяющих двум и более критериям.

МАКС()

Статистическая функция МАКС возвращает наибольшее значение в диапазоне ячеек:

МИН()

Статистическая функция МИН возвращает наименьшее значение в диапазоне ячеек:

НАИБОЛЬШИЙ()

Возвращает n-ое по величине значение из массива числовых данных. Например, на рисунке ниже мы нашли пятое по величине значение из списка.

Чтобы убедиться в этом, можно отсортировать числа в порядке возрастания:

НАИМЕНЬШИЙ()

Возвращает n-ое наименьшее значение из массива числовых данных. Например, на рисунке ниже мы нашли четвертое наименьшее значение из списка.

Если отсортировать числа в порядке возрастания, то все станет гораздо очевидней:

МЕДИАНА()

Статистическая функция МЕДИАНА возвращает медиану из заданного массива числовых данных. Медианой называют число, которое является серединой числового множества. Если в списке нечетное количество значений, то функция возвращает то, что находится ровно по середине. Если же количество значений четное, то функция возвращает среднее для двух чисел.

Например, на рисунке ниже формула возвращает медиану для списка, состоящего из 14 чисел.

Если отсортировать значения в порядке возрастания, то все становится на много понятней:

МОДА()

Возвращает наиболее часто встречающееся значение в массиве числовых данных.

Если отсортировать числа в порядке возрастания, то все становится гораздо понятней:

Статистическая функция МОДА на данный момент устарела, точнее, устарела ее форма записи. Вместо нее теперь используется функция МОДА.ОДН. Форма записи МОДА также поддерживается в Excel для совместимости.

Как известно, категория Статистические в Excel содержит более 100 самых разноплановых функций. Но, как показывает практика, львиная доля этих функций практически не применяется, а особенно начинающими пользователями. В этом уроке мы постарались познакомить Вас только с самыми популярными статистическими функциями Excel, которые Вы рано или поздно сможете применить на практике. Надеюсь, что данный урок был для Вас полезен. Удачи Вам и успехов в изучении Excel.

Оцените качество статьи. Нам важно ваше мнение:

шаблон гугл-таблицы, правила ее заполнения и проверка показателей

Михаил Шардин

кандидат технических наук

Профиль автора

Привет, меня зовут Михаил, и у меня нет кредитов, ипотеки и работы. Инвестировать я начал, когда еще был студентом.

Моя основная финансовая боль всегда была связана с эффективным учетом всех активов — то есть всего, что у меня есть. Я инвестирую через различных брокеров, не только в РФ, но и за ее пределами, а еще вкладываю в недвижимость, депозиты, монеты и страхование юнит-линкед.

Мне было сложно увидеть полную картину активов, потому что у разных финансовых посредников нет единой формы и стандарта отчетов. Ни одна из программ, которыми я пользовался, не подходила мне на сто процентов: в основном приходилось слишком долго возиться с добавлением новых бумаг, подтягиванием нужных котировок.

Поэтому я разработал собственную отчетную форму в «Гугл-таблицах»: туда я импортирую отчеты разных брокеров и записываю активы, чтобы понимать, что происходит с моим капиталом, и видеть достоверный бюджет поступлений на месяц вперед.

Таблица активов

Как работает таблица

Изначально мой отчет был табличкой в экселе с использованием упрощенного языка программирования VBA, но сейчас я перенес его в гугл-таблицу без использования скриптов.

Чтобы таблица была не просто очередным шаблоном, я дал ей собственное имя — SilverFir: Investment Report. Название говорит о том, что это инвестиционный отчет, а silver fir отсылает к разновидности вечнозелёных деревьев.

Прежде чем пошагово расписать, как пользоваться шаблоном гугл-таблицы, необходимо сделать несколько важных пояснений.

Форматы данных. В настройках таблицы указаны региональные настройки Соединенных Штатов. Это означает, что разделитель целой и дробной части числа — точка, то есть 105.1 — правильная запись, а 105,1 выдаст ошибку. Это сделано, чтобы не загромождать формулы автоматической заменой точки на запятую. Все американские и многие российские сайты выдают цены именно с точкой в качестве разделителя.

Даты указаны в формате «год-месяц-день», то есть «2020-03-11» — 11 марта 2020 года.

Разделитель в формулах при американских региональных настройках — запятая, в отличие от российского формата — точки с запятой. Если вы будете переносить формулы в какие-то свои таблицы, имейте это в виду.

УЧЕБНИК

Как победить выгорание

Курс для тех, кто много работает и устает. Цена открыта — назначаете ее сами

Начать учиться

Основные параметры, используемые в таблице. Чтобы заполнить таблицу и корректно ею пользоваться, необходимо знать следующие параметры:

  1. Идентификатор — обычно тикер или ISIN, международный идентификационный код ценной бумаги.
  2. Валюта — в соответствии с кодами валют: USD, RUB, EUR, GBP.
  3. Дата покупки — нужна, чтобы считать доходность и определять стоимость в рублях на момент покупки, если актив в валюте, отличной от рубля.
  4. Количество — может измеряться и в штуках, и в квадратных метрах.
  5. Цена покупки — заносится вместе с комиссией, ведь иной раз за сделку приходится платить ощутимые комиссионные.

Знание экселя и регулярных выражений не помешает

Актуальные цены многих активов подтягиваются со сторонних сайтов с помощью функции ImportXML. Для разных активов используются разные сайты. Например, данные по актуальной стоимости квартиры на Арбате я беру с сайта «Домофонд». И тут две проблемы.

Во-первых, если «Домофонд» обновит структуру сайта, формула может слететь, потому что она обращается к конкретной части страницы. На момент публикации статьи все формулы работают, но со временем что-то может поменяться.

Во-вторых, если вы захотите подтягивать актуальную цену квартиры в другом районе или городе, формулу нужно будет переписать.

Если вам нужна будет помощь с этим, я постараюсь отвечать в комментариях к статье.

Пошаговое руководство по заполнению

По ссылке откроется сразу ваша копия таблицы — можно редактировать данные прямо в ней. Никто другой не имеет доступа к данным в вашей копии.

Представим, что у вас есть несколько типов активов: два вклада в разных валютах, ИИС, обычный брокерский счет, арендная квартира в Москве и монета «Георгий Победоносец». Разберемся, как получить полную картину по сбережениям.

Начнем с вкладов. Готовые примеры занесены в строки 7 и 8 таблицы.

Пусть это будет вклад 50 000 Р под 5,8% годовых, открытый 22 марта 2020 года сроком на год — до 22 марта 2021 года. Разнесем данные по столбцам таблицы:

Как следить за бюджетом

  1. «Имя» — произвольное.
  2. «Базовая цена» — 50 000 Р.
  3. «Ожидаемая дох-ть, %» — 5,8.
  4. «Дата поступления» — 2021-03-22. Это дата, когда вы сможете обналичить вклад.
  5. «Размер поступления» — в ячейке уже стоит формула, суммирующая первоначальную сумму вклада и ожидаемый доход.
  6. «Валюта» — RUB.
  7. «Посредник» — в этой ячейке я указываю название брокера, банка или просто тип активов, например «вклады». Это нужно для того, чтобы было удобно просматривать данные в сводных таблицах.
  8. «Дата покупки» — 2020-03-22.

Если ваш вклад не в рублях, то таблица автоматически рассчитает начальные затраты в рублях в столбце «Цена покупки, Р» по курсу на дату открытия вклада.

На скриншоте показаны столбцы, которые надо заполнить вручную. Остальные столбцы скрыты

Индивидуальный инвестиционный счет (ИИС). Допустим, что на ИИС куплено 100 облигаций федерального займа ОФЗ-ПД 26225. Код этой ценной бумаги — SU26225RMFS1. Облигации куплены 3 сентября 2018 года по цене 89% от номинала.

Код ценной бумаги можно посмотреть в отчете брокера или на сайте биржи

Разнесем данные по столбцам таблицы, которые надо заполнить вручную:

  1. «Имя» — ОФЗ-ПД 26225 10/05/34.
  2. «Идентификатор» — SU26225RMFS1.
  3. «Кол-во» — 1000 штук. Не 100, потому что цена облигации на Мосбирже указывается в процентах. Для того чтобы корректно вести расчеты в рублях, эти проценты можно умножить на 10: номинал облигации — 1000 Р.
  4. «Базовая цена»: 1000 Р (номинал облигации) × 89% (цена покупки) × 100 шт. = 89 000 Р.
  5. «Валюта» — RUB.
  6. «Посредник» — в этом случае ИИС.
  7. «Дата покупки» — 2018-09-03.

На скриншоте показаны столбцы, которые надо заполнить вручную

Брокерский счет. Допустим, на брокерском счете — бумаги двух эмитентов:

  1. 70 рублевых облигаций группы компаний «Пионер» серии БО-02, код ценной бумаги — RU000A0JWK66, куплены 28 сентября 2018 года по цене 65% от номинала, то есть за 45 500 Р.
  2. 10 акций биржевого инвестиционного фонда FXMM, куплены 20 апреля 2018 года по цене 1426,8 Р за штуку.

Разнесем данные по столбцам таблицы. Для облигаций ГК «Пионер»:

  1. «Имя» — группа компаний «Пионер» БО-02.
  2. «Идентификатор» — RU000A0JWK66.
  3. «Кол-во» — 700 штук.
  4. «Базовая цена» — 1000 Р × 65% × 70 шт. = 45 500 Р.
  5. «Валюта» — RUB.
  6. «Посредник» — рос. брокер.
  7. «Дата покупки» — 2018-09-28.

Для фонда FXMM:

  1. «Имя» — FinEx Cash Equivalents UCITS ETF.
  2. «Идентификатор» — FXMM.
  3. «Кол-во» — 10 штук.
  4. «Базовая цена» — 1426,8 Р × 10 шт. = 14 268 Р.
  5. «Валюта» — RUB.
  6. «Посредник» — рос. брокер.
  7. «Дата покупки» — 2018-04-20.

Если в дальнейшем я буду докупать те же бумаги, нужно просто обновить в этой строке количество бумаг и базовую цену. Остальные значения остаются неизменными. Таким образом, «Дата покупки» — это, строго говоря, дата первой покупки актива.

На скриншоте показаны столбцы, которые надо заполнить вручную

Квартира в Москве. Основная идея табличного отчета в том, что можно брать цены на совершенно любые классы финансовых активов — лишь бы они публиковались в интернете в свободном доступе. Так и с недвижимостью: есть множество сайтов, которые публикуют статистику цен. Представим, что у вас есть доля в мини-квартире в Москве, в районе Арбата. Квартира сдается в аренду. Правда, вам принадлежит всего 1 м². Купили вы эту долю 13 декабря 2017 года за 460 000 Р. Каждый месяц 25 числа вы получаете арендный доход — 3742 Р.

Разнесем данные по столбцам таблицы:

  1. «Имя» — квартира в Москве, район Арбат.
  2. «Кол-во» — 1 м².
  3. «Базовая цена» — 460 000 Р.
  4. «Дата поступления» — в этой ячейке записана формула, которая всегда будет показывать дату следующего платежа. В примере это 25 число, его можно поменять на любое другое.
  5. «Размер поступления» — ежемесячный платеж, который поступает вам за аренду.
  6. «Ожидаемая доходность» — из расчета, что платят 10 месяцев в году: Ежемесячный платеж × 10 / Текущая стоимость недвижимости × 100.
  7. «Валюта» — RUB.
  8. «Дата покупки» — 2017-12-13.

На скриншоте показаны столбцы, которые надо заполнить вручную

Монета «Георгий Победоносец». Такая же ситуация и с инвестиционными монетами. Например, 11 лет назад, 13 июля 2009 года, вы купили 50 серебряных монет «Георгий Победоносец» номиналом 3 Р. Заплатили 600 Р за каждую.

Разнесем данные по столбцам таблицы:

  1. «Имя» — Георгий Победоносец (3 рубля).
  2. «Кол-во» — 50 штук.
  3. «Базовая цена» — 30 000 Р.
  4. «Посредник» — монеты.
  5. «Дата покупки» — 2009-07-13.

На скриншоте показаны столбцы, которые надо заполнить вручную

Что делать после заполнения данных

После того как вы внесете исходные данные, сразу можно увидеть работу формул. Данные начнут скачиваться, и таблица автоматически заполнится недостающими параметрами.

Теперь можно узнать следующие показатели по каждому из активов:

  1. Прибыль или убыток у вас по позиции на текущий момент в рублях — независимо от валюты вложения: столбец G.
  2. Сколько процентов годовых приносит эта инвестиция, если срок больше года, или просто процент изменения, если срок меньше года: столбец H.
  3. Ожидаемая доходность и средний ежемесячный доход в валюте вложения: столбцы J и K.
  4. Даты грядущих поступлений — или прошлых, если информация по будущим выплатам еще недоступна: столбцы L и M. Если вы покупаете дивидендные акции, ячейки посчитают размер и дату ближайшего дивиденда.
  5. Процентное изменение бумаги за последние несколько лет для акций: столбец I. За сколько именно — зависит от сайта, откуда берутся данные.
  6. Текущий вес бумаги в портфеле: столбец V.

Дополнительно вручную можно указать категории и классы активов, если вы хотите смотреть распределение и по ним. Автоматическое скачивание возможно реализовать только на гугл-скриптах.

Анализ сводных показателей портфеля

Перейдем теперь к сводным показателям всего портфеля. Их можно смотреть на разных вкладках.

«Данные» — это главная вкладка, куда вносятся все исходные. Светло-голубым выделены ячейки, которые надо заполнить вручную. Также на этой вкладке рассчитывается прибыль и убыток по позиции, дата и размер ближайшего поступления от актива.

«Валюты» — полностью автоматическая вкладка, которая содержит отчет по используемым валютам. Как только вы редактируете что-либо на вкладке «Данные», этот мини-отчет сразу меняется.

Скриншот вкладки «Валюты»

«Посредники» — отчетная вкладка, которая показывает распределение сумм по брокерам и весовое значение процента капитала. Еще она показывает количество бумаг у каждого брокера и расчетный ежемесячный доход, также этот доход отображается в процентах годовых.

На этой вкладке можно оценить, насколько успешен тот или иной счет, потому что отображаются изменения в рублях с момента покупки.

Скриншот вкладки «Посредники»

«Классы активов» — здесь вы увидите отчет о диверсификации вашего портфеля. Я формализовал описания классов активов из Quicken и описаний нескольких авторов, в том числе Сергея Спирина, Александра Силаева, Павла Комаровского.

Скриншот вкладки «Классы активов»

«Покупки» — это мини-отчет об истории покупок по времени. Здесь вы сможете узнать, в каком месяце сколько денег потратили.

Скриншот вкладки «Покупки»

«Капитал» — на этой вкладке отображается текущая дата и две совокупных стоимости всех активов: стоимость покупки и текущая рыночная стоимость портфеля в рублях. Эта вкладка реализована с помощью формул, а формулы не могут сами копироваться в другие ячейки — для создания истории придется вручную копировать эти данные на строчку ниже.

Скриншот вкладки «Капитал»

«Капитал график» — визуализирует данные с вкладки «Капитал».

«Идентификаторы» — в графическом виде отображает распределение по бумагам в таблице.

Скриншот вкладки «Идентификаторы»

«Отчет» — сводный отчет о планируемых поступлениях на три месяца вперед в рублях, то есть сумма купонов, арендных платежей. Также вкладка дает информацию о ближайших выплатах на 30 дней вперед и назад, а еще — о лидерах роста и падения вместе с историей капитала.

Скриншот вкладки «Отчет»

Запомнить

  1. Эта таблица — удобный вариант, когда у вас несколько разных брокеров, в том числе зарубежных, и есть доходная недвижимость. Вклады и другие активы тоже легко учесть.
  2. Данные в вашем экземпляре таблицы принадлежат только вам, ни у кого другого не будет к ним доступа. В любой момент только вы сами можете изменить или удалить любую информацию из вашей копии.
  3. За счет автоматических мини-отчетов на основе данных из таблицы вы всегда знаете, что происходит в портфеле. Неважно, насколько он сложен.
  4. Если вы хотите добавить свой актив, изменение цены на который можно отслеживать на общедоступном сайте, то напишите мне в комментарии к статье. Я помогу с написанием формулы или гугл-скрипта.

Microsoft Excel 2010 — «Простейший способ подсчета просмотров отзывов в Excel. Всего 2 минуты в день — и ваша полная статистика по просмотрам готова. Чем полезна программа для авторов Айрека?»

Программа Microsoft Excel настолько многофункциональна и обладает таким мощным вычислительным потенциалом, что круг ее применения чрезвычайно широк.

Поскольку форма статистики по просмотрам отзывов для авторов Айрека не отличается развенутостью, рано или поздно становится нужен отдельный инструмент для отслеживания просмотров. Плюс полезна возможность быстро отсортировать данные и посмотреть информацию по конкретным отзывам на конкретную дату, а также выявить наиболее быстро растущие отзывы. Если пойти дальше и применить немного фантазии — на этих данных можно сделать и другие полезные выводы: оптимальные дни для размещения отзывов, самые популярные тематики, наиболее удачные схемы написания и т.п. И все это — ровно за 2 минуты в день — меньше, чем вы потратите, просто листая и просматривая страницы со статистикой

 

Создание таблицы для хранения просмотров

Сразу нужно оговориться, что создание подобного документа доступно в любой версии Excel, поскольку технически здесь нет ничего сверхъестественного.

  1. Для начала нужно создать новый документ Microsoft Excel (открыть окно с программой с пустой таблицей). В этом документе создаем 3 листа (вкладки). Изначально у вас уже будет открыт один, добавляем к нему еще два.
  2. Переименовываем вкладки следующим образом: «Данные», «Просмотры по датам», «Оценки по датам». Вы можете выбрать любое название, можно просто «данные», «просмотры» и «оценки».
  3. На первую вкладку «Данные» мы будем добавлять информацию по вашим просмотрам из статистики Айрека. Делается это элементарно: открываем статистику, выделяем ее от первого значения и до последнего — и вставляем в таблицу «как значения». Очень важно выделять именно с первого символа и до последнего, без лишних пробелов в конце, чтобы данные встали в таблицу ровно.
  4. Данные со следующих страниц статистики — добавляем в эту же таблицу ниже. Единственное неудобство — если у вас уже написано 500+ отзывов — придется потратить время, чтобы скопировать все страницы. Но я пока не знаю способа упростить эту ручную процедуру (ну, и на 180 отзывов у меня уходит максимум минута).

 

Подсчет просмотров

Далее переходим на вкладку «Просмотры». Здесь мы создаем таблицу следующего вида.

В первом столбце у меня стоит дата написания — можно его не создавать, если вам не нужно (в любой момент можно будет извлечь эти данные с первой вкладки).

  1. Названия товаров вставляем руками с вкладки «Данные» (понадобится сделать это только один раз, потом только добавлять новые). Как сделать это быстро: держите нажатой Ctrl и прокликиваете ячейки с названиями товаров в данных. Потом нажимаете Ctrl+C, и вставляете все сразу на вкладку «просмотры». Важно взять именно названия товаров, а не отзывов.
  2. Следующие столбцы называем «Разница», «за вчера» и далее — по датам. Можно обозначить строкой выше дни недели.
  3. Теперь прописываем самое главное — формулы для сбора количества просмотров по отзывам и для подсчета прироста просмотров за день. Для этого в ячейке «за вчера» пишем следующую формулу:

    Т.е. =ВПР — это исполняемая функция. Далее в скобках пишем для нее аргументы:

  • в скобках указывается ячейка с названием отзыва из этой же строки
  • точка с запятой
  • выделяем на вкладке «Данные» 2,3,4 столбцы полностью (ведем курсором над этими столбцами)
  • нажимаем F4 для закрепления столбцов в формуле
  • точка с запятой
  • пишем цифру 3
  • точка с запятой
  • пишем ЛОЖЬ
  • закрываем скобку, нажимаем Enter

Такая формула ищет совпадение названия товара в указанном диапазоне на первой вкладке, и если находит его — выводит данные из третьего по счету столбца в нем — а там у нас как раз идет количество просмотров. ЛОЖЬ означает, что ищется точное соответствие названия товара.

Далее размножаем эту формулу на весь столбец вниз (растянуть, или двойной клик на нижнем правом углу ячейки, когда она выделена). Так — теперь вы видите просмотры по всем отзывам за вчерашний день.

 

Расчет роста просмотров

Далее считаем, насколько приросло количество просмотров по каждому отзыву по сравнению с предыдущим днем. Для этого у вас должна быть собрана статистика хотя бы за 2 дня подряд — или можете сначала посчитать разницу от пустой ячейки.

Для этого в ячейке столбца «разница» прописываем формулу: данные «за вчера» минус данные за предыдущий день.

Так же размножаем ее вниз по столбцу.

На этой же вкладке справа можно вести статистику по ежедневному приросту просмотров.

Для этого либо дублируем формулу по разнице и каждый день добавляем с ней новый столбец — либо данные из «разницы» можно просто ежедневно копировать и вставлять рядом «как значения». Я делаю формулой, мне кажется, так быстрее.

 

Подсчет оценок

На вкладке «Оценки» мы создаем таблицу, как и в «Просмотрах», с одним лишь отличием — в формуле ВПР вместо цифры «3» ставим цифру «2» (так цифры будут браться из 2-го столбца диапазона «Данных» — там, где прописано количество оценок к отзывам). Теперь можно видеть количество оценок к каждому отзыву и разницу по ним на каждый день.

Собственно, на этом создание рабочего документа закончено — его можно сохранить, а дальше только ежедневно обновлять, чтобы видеть полную картину по просмотрам.

 

Дополнение данных

Чтобы данные копились у вас каждый день, их нужно обновлять. Для этого нужно:

  1. Добавлять по одному новому столбцу на вкладках «Просмотры» и «Оценки». Для этого нужно выделить весь столбец с последней датой и нажать «Вставить» (важно — до этого не должны быть скопированы другие данные). Прописать в заголовках дату и день недели (можно выделить две ячейки справа и протянуть их за нижний правый угол налево в новую ячейку — сработает автозаполнение).
  2. Скопировать данные из столбца «Вчера» в столбец с новой датой «как значения».
  3. Поправить формулу в столбце «Разница» — она сдвигается на одну ячейку при вставке нового столбца, поэтому там нужно указать другую ячейку.
  4. Скопировать данные из «Разницы» в таблицу рядом.
  5. Все то же самое, кроме п.1, проделать на вкладке «Оценки».
  6. Вставить данные из статистики Айрека на вкладку «Данные», чтобы у вас происходил подсчет на текущую дату. Если у вас появился новый отзыв — добавляете название товара на вкладку «Просмотры».

 

Собственно ВСЕ Таким образом у вас всегда будут сохраняться актуальные данные по просмотрам и оценкам и по разнице на каждый день.

 

Как интерпретировать данные

Помимо просто хранения данных, их можно использовать для того, чтобы делать разные полезные выводы для дальнейшего написания отзывов:

  1. При помощи автофильтра и сортировки можно посмотреть отзывы, которые набирают больше всего просмотров за день — и больше всего просмотров за все время.
  2. Можно оценить, как на просмотры отзывов влияет день недели, выходные, праздники.
  3. Отслеживать результаты оптимизированных отзывов.
  4. Отслеживать динамику прироста просмотров (просмотров в день становится ежедневно больше или они, наоборот, падают).

 

Другие полезные возможности

Также, если вы поняли принцип работы функции ВПР, вы можете с помощью нее извлечь дату написания отзыва или, например, заработок по нему, чтобы добавить их в таблицу. Также вы можете создать отдельную вкладку и заносить туда строки с вашими ежедневными изменениями баланса. Если интересно, можно создавать на основе данных графики по изменению просмотров по отзывам и по дням — но я лично с этим не заморачиваюсь.

 

Фишки

Несколько полезных фишек при работе в Excel:

  1. Выделение сразу всех данных в столбце: ставим курсор на верхнюю ячейку, Ctrl+»вниз».
  2. «Протянуть» формулу вниз — ставим курсор на ячейку и двойной клик по ее правому нижнему углу.
  3. Чтобы верхние строки оставались всегда на виду при прокрутке: Вид-Закрепление областей-Закрепить области.
  4. Для сортировки и поиска нужных значений в столбцах используем автофильтр (выделяем нужную строку и включаем по ней фильтр)

 

5. ​Чтобы введенные вами ранее данные не стерлись или вы их случайно не отредактировали, можно защитить отдельные ячейки от редактирования. Для этого выделяем нужную область, нажимаем правую кнопку мыши — Формат ячеек — Защита, поставить галку «Защищаемая ячейка». Далее включаем защиту на листе: Рецензирование — Защитить лист, поставить галку «Защитить лист и содержимое ячеек».

 

Вот так просто можно собирать и анализировать данные по вашим просмотрам и оценкам отзывов принципе, при глубоком знании Excel можно делать и более сложные и интересные вещи — но мне лично хватает этой простой схемы. Надеюсь, вам она тоже пригодится!

 

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

Как зарабатывать на IRecommend? Пошаговое руководство по заработку от специалиста по поисковой оптимизации: стратегия, инструменты, размер заработка, повышение эффективности

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

Использование Excel для анализа данных

Использование Excel для анализа данных

Использование Excel для статистического анализа данных — предостережения

Ева Голдуотер
Консультационный центр биостатистики
Школа общественного здравоохранения Массачусетского университета
обновлено, февраль 2007 г.,

Кратко
Введение
Общие вопросы
Результаты анализов
Сводка

Мы использовали Excel для выполнения некоторых основных задач анализа данных, чтобы увидеть, является ли это разумной альтернативой использованию статистического пакета для тех же задач.Мы пришли к выводу, что Excel — плохой выбор для статистического анализа, помимо примеров из учебников, простейшей описательной статистики или для более чем нескольких столбцов. Проблемы, с которыми мы столкнулись, которые привели к такому выводу, относятся к четырем основным направлениям:

  • Отсутствующие значения обрабатываются непоследовательно, а иногда и неправильно.
  • Организация данных различается в зависимости от анализа, что вынуждает вас реорганизовать данные разными способами, если вы хотите провести много разных анализов.
  • Многие анализы могут выполняться только для одного столбца за раз, что затрудняет выполнение одного и того же анализа для нескольких столбцов.
  • Вывод плохо организован, иногда неадекватно маркирован, и нет записи о том, как был проведен анализ.

Excel удобен для ввода данных и быстрого управления строками и столбцами перед статистическим анализом. Однако, когда вы будете готовы провести статистический анализ, мы рекомендуем использовать статистический пакет, такой как SAS, SPSS, Stata, Systat или Minitab.

Excel, вероятно, является наиболее часто используемой электронной таблицей для ПК. Недавно приобретенные компьютеры часто поставляются с уже загруженным Excel. Его легко использовать для выполнения различных расчетов, он включает набор статистических функций и пакет инструментов для анализа данных. В результате, если вы вдруг обнаружите, что вам нужно провести статистический анализ, вы можете обратиться к нему как к очевидному выбору. Мы решили провести небольшое тестирование, чтобы увидеть, насколько хорошо Excel будет служить приложением для анализа данных.

Для представления результатов воспользуемся небольшим примером. Данные для этого примера вымышлены. Было выбрано две категориальные и две непрерывные переменные, чтобы мы могли протестировать множество основных статистических методов. Поскольку почти во всех реальных наборах данных есть по крайней мере несколько недостающих точек, и поскольку способность правильно обрабатывать отсутствующие данные является одной из функций, которые мы принимаем как должное в пакете статистического анализа, мы ввели две пустые ячейки в данные:

Лечение

Результат

Х

Я

1

1

10.2

9,9

1

1

9,7

2

1

10,4

10,2

1

2

9.8

9,7

2

1

10,3

10,1

1

2

9,6

9,4

2

1

10.6

10,3

1

2

9,9

9,5

2

2

10,1

10

2

2

10.2

Каждая строка таблицы представляет тему. Первый субъект получил лечение 1 и имел Результат 1. X и Y — значения двух измерений для каждого субъекта. Нам не удалось получить измерение Y по второму объекту или по X по последнему объекту, поэтому эти ячейки пусты. Субъекты вводятся в том порядке, в котором данные стали доступны, поэтому данные не упорядочены каким-либо определенным образом.

Мы использовали эти данные для выполнения простого анализа и сравнения результатов со стандартным статистическим пакетом.При сравнении учитывалась точность результатов, а также простота использования интерфейса для больших наборов данных, т. Е. Большего количества столбцов. Мы использовали SPSS в качестве стандарта, хотя любой из статистических пакетов, поддерживаемых OIT, также подходит для этой цели. В этой статье, когда мы говорим «статистический пакет», мы имеем в виду SPSS, SAS, STATA, SYSTAT или Minitab.

Большинство статистических процедур Excel являются частью пакета инструментов анализа данных, который находится в меню «Инструменты».Он включает в себя множество вариантов, включая простую описательную статистику, t-тесты, корреляции, одно- или двухфакторный дисперсионный анализ, регрессию и т. Д. Если у вас нет пункта Анализ данных в меню Инструменты, вам необходимо установить Данные Пакет инструментов анализа. Найдите в справке «Инструменты анализа данных» инструкции по загрузке ToolPak.

Две другие функции Excel полезны для определенного анализа, но пакет инструментов анализа данных — единственный, который обеспечивает достаточно полные тесты статистической значимости.Сводную таблицу в меню «Данные» можно использовать для создания сводных таблиц средних значений, стандартных отклонений, подсчетов и т. Д. Кроме того, вы можете использовать функции для создания некоторых статистических показателей, таких как коэффициент корреляции. Функции генерируют одно число, поэтому, используя функции, вам, вероятно, придется комбинировать кусочки и кусочки, чтобы получить то, что вы хотите. Даже в этом случае вы не сможете создать все части, необходимые для полного анализа.

Если не указано иное, все статистические тесты с использованием Excel проводились с помощью пакета Data Analysis ToolPak.Для проверки различных статистических тестов мы выбрали следующие задачи:

  • Получите средние и стандартные отклонения X и Y для всей группы и для каждой группы обработки.
  • Получите корреляцию между X и Y.
  • Выполните двухвыборочный t-тест, чтобы проверить, различаются ли две группы лечения по X и Y.
  • Проведите парный t-тест, чтобы проверить, отличаются ли X и Y статистически друг от друга.
  • Сравните количество субъектов с каждым результатом по группам лечения, используя критерий хи-квадрат.

Все эти задачи являются стандартными для набора данных такого рода, и все они могут быть легко выполнены с использованием любого из перечисленных выше статистических пакетов.

Включение пакета инструментов анализа

Пакет Data Analysis ToolPak не устанавливается со стандартной установкой Excel. Посмотрите в меню «Инструменты». Если у вас нет элемента анализа данных, вам необходимо установить инструменты анализа данных.Для получения инструкций поищите в справке «Инструменты анализа данных».

Отсутствующие значения

Пустая ячейка — единственный способ для Excel обработать недостающие данные. Если у вас есть другие коды отсутствующих значений, вам нужно будет заменить их пустыми.

Организация данных

Для разных анализов данные должны быть упорядочены по-разному. Если вы планируете проводить множество различных тестов, возможно, не будет какой-либо единой схемы, которая будет работать. Вероятно, вам придется переставить данные несколькими способами, чтобы получить все, что вам нужно.

Диалоговые окна

Выберите Инструменты / Анализ данных и выберите тип анализа, который вы хотите провести. Типичное диалоговое окно будет содержать следующие элементы:
Диапазон ввода: введите верхний левый и нижний правый угол ячейки. например A1: B100. Вы можете выбирать только соседние строки и столбцы. Если нет флажка для группировки данных по строкам или столбцам (а его обычно нет), все данные рассматриваются как один глобус.
Ярлыки. Иногда можно установить флажок, чтобы указать, что первая строка вашего листа содержит ярлыки.Если у вас есть метки в первой строке, установите этот флажок, и ваш результат МОЖЕТ быть помечен вашей меткой. Опять же, это не может быть.
Место вывода — по умолчанию используется новый лист. Или введите адрес ячейки в верхнем левом углу того места, где вы хотите разместить вывод на текущем листе. Новый рабочий лист — еще один вариант, который я не пробовал. Разветвления этого выбора обсуждаются ниже.
Остальные предметы, в зависимости от анализа.

Расположение выхода

Выходные данные каждого анализа могут быть перенесены на новый лист в текущем файле Excel (это значение по умолчанию), или вы можете поместить его в текущий лист, указав ячейку в верхнем левом углу, где вы хотите, чтобы она была размещена.В любом случае это немного неудобно. Если каждый вывод находится на новом листе, вы получаете много листов, на каждом из которых выводится небольшой бит. Если вы разместите их на текущем листе, вам нужно будет разместить их соответствующим образом; оставьте место для добавления комментариев и меток; изменения, которые необходимо внести для правильного форматирования одного вывода, могут отрицательно повлиять на другой вывод. Пример: в выходных данных Descriptives есть столбец с метками, такими как «Стандартное отклонение», «Стандартная ошибка» и т. Д. Вы захотите сделать этот столбец широким, чтобы можно было читать метки.Но если простой выход Frequency находится прямо под ним, тогда столбец, отображающий подсчитываемые значения, который может содержать только небольшие целые числа, также будет широким.

Описательная статистика

Самый быстрый способ получить средние значения и стандартные отклонения для всей группы — использовать описательные элементы в инструментах анализа данных. Вы можете выбрать несколько соседних столбцов для диапазона ввода (в данном случае столбцы X и Y), и каждый столбец анализируется отдельно.Метки в первой строке используются для маркировки вывода, а пустые ячейки игнорируются. Если у вас есть больше несмежных столбцов, которые вам нужно проанализировать, вам придется повторить процесс для каждой группы смежных столбцов. Процедура проста, позволяет достаточно эффективно управлять множеством столбцов, а пустые ячейки обрабатываются должным образом.

Чтобы получить средние значения и стандартные отклонения X и Y для каждой группы лечения, необходимо использовать сводные таблицы (если вы не хотите изменить порядок таблицы данных, чтобы разделить две группы).После выбора (непрерывного) диапазона данных в параметре «Макет» мастера сводных таблиц перетащите «Обработка» в область переменных строки, а X — в область «Данные». Дважды щелкните «Count of X» в области данных и измените его на «Среднее». Снова перетащите X в поле данных и на этот раз измените Count на StdDev. Наконец, перетащите X еще раз, оставив его как Count of X. Это даст нам Среднее, стандартное отклонение и количество наблюдений в каждой группе обработки для X. Сделайте то же самое для Y, чтобы мы получили среднее, стандартное отклонение и количество наблюдений для Y тоже.Это поместит в общей сложности шесть элементов в поле данных (три для X и три для Y). Как видите, если вы хотите получить разнообразную описательную статистику для нескольких переменных, процесс станет утомительным.

Статистический пакет позволяет вам выбрать любое количество переменных для описательной статистики, независимо от того, являются ли они смежными или нет. Вы можете получить описательную статистику по всем предметам вместе или с разбивкой по категориальной переменной, такой как лечение. Вы можете выбрать статистику, которую хотите просмотреть один раз, и она будет применяться ко всем выбранным переменным.

Корреляции

При использовании инструментов анализа данных диалоговое окно для корреляций во многом похоже на диалог для описательных элементов — вы можете выбрать несколько смежных столбцов и получить выходную матрицу всех пар корреляций. Пустые ячейки игнорируются соответствующим образом. Выходные данные НЕ включают количество пар точек данных, используемых для вычисления каждой корреляции (которое может варьироваться в зависимости от того, где у вас отсутствуют данные), и не указывает, являются ли какие-либо из корреляций статистически значимыми.Если вам нужны корреляции для несмежных столбцов, вам придется либо включить промежуточные столбцы, либо скопировать нужные столбцы в смежное место.

Статистический пакет позволит вам выбирать несмежные столбцы для корреляций. Выходные данные сообщат вам, сколько пар точек данных использовалось для вычисления каждой корреляции и какие корреляции являются статистически значимыми.

Двухвыборочный Т-тест

Этот тест можно использовать для проверки, различаются ли две группы лечения по значениям X или Y.Для проведения теста вам необходимо ввести диапазон ячеек для каждой группы. Поскольку данные не были введены по группе лечения, нам сначала нужно отсортировать строки по лечению. Обязательно возьмите все остальные столбцы вместе с лечением, чтобы данные по каждому предмету остались нетронутыми. . После сортировки данных вы можете ввести диапазон ячеек, содержащий измерения X для каждого лечения. Не включайте строку с метками, потому что вторая группа не имеет строки с метками. Поэтому ваш вывод не будет помечен, чтобы указать, что этот вывод предназначен для X.Если вы хотите, чтобы результат был помечен, вам нужно скопировать ячейки, соответствующие второй группе, в отдельный столбец и ввести строку с меткой для второй группы. Если вы также хотите провести t-тест для измерений Y, вам нужно будет повторить процесс. Пустые ячейки игнорируются, и, за исключением проблем с маркировкой вывода, результаты верны.

Статистический пакет выполнит эту задачу без необходимости сортировать данные или копировать их в другой столбец, а выходные данные всегда будут правильно помечены в той степени, в какой вы предоставляете ярлыки для своих переменных и групп лечения.Это также позволит вам выбрать более одной переменной за раз для t-теста (например, X и Y).

Парный t-тест

Парный t-критерий — это метод проверки того, существенно ли отличается разница между двумя измерениями на одном и том же предмете от 0. В этом примере мы хотим проверить разницу между X и Y, измеренными на одном и том же предмете. Важной особенностью этого теста является то, что он сравнивает измерения в пределах каждого предмета.Если вы просканируете столбцы X и Y по отдельности, они не будут выглядеть явно по-разному. Но если вы посмотрите на каждую пару X-Y, вы заметите, что в каждом случае X больше, чем Y. Парный t-тест должен быть чувствителен к этой разнице. В двух случаях, когда отсутствует X или Y, невозможно сравнить две меры по предмету. Следовательно, для парного t-критерия можно использовать только 8 строк.

Когда вы запускаете парный t-тест для этих данных, вы получаете t-статистику 0,09 с вероятностью 2 хвостов, равной 0.93. Тест не обнаруживает какой-либо существенной разницы между X и Y. При более внимательном рассмотрении результатов мы замечаем, что в нем указано 9 наблюдений. Как отмечалось выше, их должно быть только 8. Похоже, что Excel не удалось исключить наблюдения, для которых не использовались измерения X и Y. Чтобы получить правильные результаты, скопируйте X и Y в два новых столбца и удалите данные в ячейках, которые не имеют значения для другой меры. Теперь повторно запустите парный t-тест. На этот раз t-статистика равна 6.14817 с 2-хвостовой вероятностью 0,000468. Вывод совершенно другой!

Конечно, это крайний пример. Но дело в том, что Excel неправильно вычисляет парный t-критерий, когда в некоторых наблюдениях есть одно из измерений, а другое нет. Хотя возможно получить правильный результат, у вас не будет причин подозревать полученные результаты, если только вы не будете достаточно бдительны, чтобы заметить, что количество наблюдений неверно. В интерактивной справке нет ничего, что могло бы предупредить вас об этой проблеме.

Интересно, что есть также функция TTEST, которая дает правильные результаты для этого примера. Очевидно, функции и инструменты анализа данных несовместимы в том, как они работают с отсутствующими ячейками. Тем не менее, я не могу рекомендовать использовать функции вместо инструментов анализа данных, потому что результатом использования функции является одно число — в данном случае вероятность с двумя хвостами t-статистики. Эта функция не дает вам саму t-статистику, степени свободы или любое количество других элементов, которые вы хотели бы видеть, выполняя статистический тест.

A статистические пакеты будут правильно исключать случаи, когда одно из измерений отсутствует, и предоставят всю вспомогательную статистику, необходимую для интерпретации выходных данных.


Перекрестная таблица и критерий независимости хи-квадрат

Наша последняя задача — подсчитать два результата в каждой группе лечения и использовать критерий независимости хи-квадрат для проверки связи между лечением и результатом.Чтобы подсчитать результаты по группам лечения, вам необходимо использовать сводные таблицы. В параметре «Макет» мастера сводных таблиц перетащите «Обработка» в строку, «Результат» в столбец, а также в «Данные». В области данных должно быть написано «Счетчик результатов» — если нет, дважды щелкните по нему и выберите «Счетчик». Если вам нужны проценты, дважды щелкните «Count of Outcome» и нажмите «Параметры»; в появившемся окне «Показать данные как» выберите «% строки». Если вам нужны и подсчеты, и проценты, вы можете дважды перетащить одну и ту же переменную в область данных и использовать ее один раз для подсчетов и один раз для процентов.

Однако пройти тест хи-квадрат не так-то просто. Он доступен только как функция, и входными данными, необходимыми для функции, являются наблюдаемые количества в каждой комбинации лечения и результата (которые у вас есть в вашей сводной таблице) и ожидаемые количества в каждой комбинации. Ожидаемые подсчеты? Кто они такие? Как их получить? Если у вас есть достаточный статистический фон, чтобы знать, как рассчитывать ожидаемые числа, и вы можете выполнять вычисления в Excel с использованием относительных и абсолютных адресов ячеек, вы должны иметь возможность перемещаться по ним.Если нет, то тебе не повезло.

Предполагая, что вы преодолели проблему ожидаемых количеств, вы можете использовать функцию Chitest, чтобы получить вероятность наблюдения значения хи-квадрат, большего, чем значение для этой таблицы. Опять же, поскольку мы используем функции, вы не получаете многих других необходимых частей вычислений, особенно значения статистики хи-квадрат или ее степеней свободы.

Ни один статистический пакет не потребует от вас предоставления ожидаемых значений перед вычислением критерия независимости хи-квадрат.Кроме того, результаты всегда будут включать статистику хи-квадрат и ее степени свободы, а также ее вероятность. Часто вы также получаете дополнительную статистику.

Остальные анализы по этому набору данных не проводились, но некоторые комментарии по ним включены для полноты.

Простые частоты

Для получения простых частот можно использовать сводные таблицы. (см. Перекрестные таблицы для получения дополнительной информации о том, как получить сводные таблицы.) При использовании сводных таблиц каждый столбец рассматривается как отдельная переменная, и на выходе будут отображаться метки в строке 1. Вы можете использовать только одну переменную за раз.

Другая возможность — использовать функцию «Частоты». Основное преимущество этого метода заключается в том, что после того, как вы определили функцию частот для одного столбца, вы можете использовать Копировать / Вставить, чтобы получить ее для других столбцов. Во-первых, вам нужно будет ввести столбец со значениями, которые вы хотите подсчитать (ячейки). Если вы собираетесь задать периодичность для многих столбцов, обязательно введите значения для столбца с наибольшим количеством категорий.например, если 3 столбца имеют значения 1 или 2, а четвертый имеет значения 1,2,3,4, вам нужно будет ввести значения ячеек как 1,2,3,4. Теперь выберите достаточно пустых ячеек в одном столбце для хранения результатов — 4 в этом примере, даже если текущий столбец имеет только 2 значения. Затем выберите в меню Вставка / Функция / Статистические данные / Частоты. Заполните диапазон ввода для первого столбца, который вы хотите подсчитать, используя относительные адреса (например, A1: A100). Заполните диапазон ячеек, используя абсолютные адреса мест, в которые вы ввели значения для подсчета (например,г. $ M $ 1: $ M $ 4). Щелкните Готово. Обратите внимание на поле над заголовками столбцов листа, где отображается формула. Он начинается с «= ЧАСТОТА («. Поместите курсор слева от знака = в формуле и нажмите Ctrl-Shift-Enter. Теперь в выбранных ячейках отображаются счетчики частоты.

Чтобы получить подсчет частот для других столбцов, выберите ячейки с частотами в них и выберите в меню «Изменить / Копировать». Если следующий столбец, который вы хотите подсчитать, находится на один столбец справа от предыдущего, выберите ячейку справа от первой частотной ячейки и выберите «Правка / Вставить» (ctrl-V).Продолжайте перемещаться вправо и вставлять для каждого столбца, который вы хотите подсчитать. Каждый раз, когда вы перемещаете один столбец вправо от исходных ячеек частоты, столбец для подсчета сдвигается вправо от первого столбца, который вы подсчитали.

Если вам также нужны проценты, вам нужно будет использовать функцию Sum, чтобы вычислить сумму частот, и определить формулу, чтобы получить процент для одной ячейки. Выберите ячейку для хранения первого процента и введите формулу в поле формулы в верхней части листа — e.г. = N1 * 100 / N $ 5 — где N1 — это ячейка с частотой для первой категории, а N5 — это ячейка с суммой частот. Используйте Копировать / Вставить, чтобы получить формулу для оставшихся ячеек первого столбца. Когда у вас есть проценты для одного столбца, вы можете скопировать / вставить их в другие столбцы. Будьте осторожны при использовании относительных и абсолютных адресов! В приведенном выше примере мы использовали N $ 5 в качестве знаменателя, поэтому, когда мы копируем формулу до следующей частоты в том же столбце, она все равно будет искать сумму в строке 5; но когда мы копируем формулу прямо в другой столбец, она переходит к частотам в следующем столбце.

Наконец, вы можете использовать гистограмму в меню анализа данных. Вы можете использовать только одну переменную за раз. Как и в случае с функцией «Частоты», вы должны ввести столбец с границами «корзины». Чтобы подсчитать количество вхождений 1 и 2, вам нужно ввести 0,1,2 в трех соседних ячейках и указать диапазон этих трех ячеек как Bins в диалоговом окне. Вывод не помечен никакими ярлыками, которые могут быть в строке 1, или даже буквой столбца. Если вы делаете частоты для большого количества переменных, вам будет трудно понять, какая частота принадлежит какому столбцу данных.

Линейная регрессия

Поскольку регрессия является одним из наиболее часто используемых статистических анализов, мы попробовали его, хотя мы не проводили регрессионный анализ для этого примера. Процедура регрессии в инструментах анализа данных позволяет выбрать один столбец в качестве зависимой переменной и набор смежных столбцов для независимых. Однако он не допускает пустых ячеек в любом месте входных диапазонов, и вы ограничены 16 независимыми переменными.Следовательно, если у вас есть пустые ячейки, вам нужно будет скопировать все столбцы, участвующие в регрессии, в новые столбцы и удалить все строки, содержащие пустые ячейки. Большие модели с более чем 16 предикторами вообще невозможны.

Дисперсионный анализ

В общем, возможности ANOVA в Excel ограничены несколькими частными случаями, которые редко встречаются за пределами учебников, и требуют большого количества перекомпоновок данных.

Односторонний дисперсионный анализ

Данные должны быть расположены в отдельных и соседних столбцах (или строках) для каждой группы.Ясно, что это не способствует выполнению односторонних действий более чем в одной группе. Если у вас есть метки в строке 1, в выводе будут использоваться метки.

Двухфакторный дисперсионный анализ без репликации

Это относится только к случаю , одно наблюдение на ячейку (т.е. без члена ошибки в ячейке). Входной диапазон представляет собой прямоугольное расположение ячеек, где строки представляют уровни одного фактора, столбцы — уровни другого фактора, а ячейка содержит одно значение в этой ячейке.

Двухфакторный дисперсионный анализ с репликами

Это двухфакторный дисперсионный анализ с равными размерами ячеек . Входные данные должны быть прямоугольной областью со столбцами, представляющими уровни одного фактора, и строками, представляющими реплики в пределах уровней другого фактора. Диапазон ввода ДОЛЖЕН также включать дополнительную строку вверху и столбец слева с метками, указывающими факторы. Однако эти метки не используются для маркировки результирующей таблицы ANOVA.Щелкните Help (Справка) в диалоговом окне ANOVA, чтобы увидеть, как должен выглядеть входной диапазон.

Запросы большого количества анализов

Если бы у вас было множество различных статистических процедур, которые вы хотели бы выполнить с вашими данными, вы почти наверняка обнаружили бы, что выполняете много операций по сортировке, перегруппировке, копированию и вставке ваших данных. Это связано с тем, что каждая процедура требует, чтобы данные были упорядочены определенным образом, часто отличным от того, как другая процедура хочет упорядочить данные.В нашем небольшом тесте нам пришлось отсортировать строки, чтобы выполнить t-тест, и скопировать некоторые ячейки, чтобы получить метки для вывода. Нам пришлось очистить содержимое некоторых ячеек, чтобы получить правильный парный t-тест, но мы не хотели, чтобы эти ячейки очищались для другого теста. А мы выполняли всего пять задач. Не становится лучше, когда ты пытаешься сделать больше. Не существует единого набора данных, который позволил бы вам выполнять множество различных анализов без создания множества различных копий данных.Необходимость манипулировать данными разными способами значительно увеличивает вероятность появления ошибок.

При использовании статистической программы данные обычно упорядочиваются по строкам, представляющим субъектов, и столбцам, представляющим переменные (как в нашем примере данных). Благодаря такому расположению вы можете выполнять любой анализ, обсуждаемый здесь, а также многие другие, без необходимости каким-либо образом сортировать или переупорядочивать свои данные. Только гораздо более сложный анализ, выходящий за рамки возможностей Excel и объема данной статьи, потребует переупорядочения данных.

Что, если бы в ваших данных было не 4, а 40 столбцов со смесью категориальных и непрерывных показателей? Насколько легко описанные выше процедуры масштабируются до более серьезной проблемы?

В лучшем случае некоторые статистические процедуры могут принимать на вход несколько смежных столбцов и интерпретировать каждый столбец как отдельную меру. Процедуры описаний и корреляций относятся к этому типу, поэтому вы можете запросить описательную статистику или корреляции для большого количества непрерывных переменных, если они введены в соседние столбцы.Если они не смежные, вам нужно переставить столбцы или использовать копирование и вставку, чтобы сделать их смежными.

Однако многие процедуры могут применяться только к одному столбцу за раз. К этому классу относятся Т-тесты (независимые или парные), простой подсчет частоты, критерий независимости хи-квадрат и многие другие процедуры. Это стало бы серьезным недостатком, если бы у вас было больше, чем несколько столбцов, даже если вы использовали вырезание и вставку или макросы, чтобы уменьшить объем работы. Помимо многократного повторения запроса, вы должны решить, где хранить результаты каждого из них, и убедиться, что он правильно помечен, чтобы вы могли легко найти и идентифицировать каждый вывод.

Наконец, Excel не предоставляет вам журнал или другую запись для отслеживания ваших действий. Это может быть серьезным недостатком, если вы хотите иметь возможность повторить тот же (или аналогичный) анализ в будущем, или даже если вы просто забыли то, что уже сделали.

Используя статистический пакет, вы можете запросить тест для любого количества переменных одновременно. Каждый из них будет правильно помечен и упорядочен на выходе, поэтому не будет путаницы в том, что к чему. Вы также можете рассчитывать на получение журнала, а часто и набора команд, которые можно использовать для документирования вашей работы или для повторения анализа без необходимости повторять все шаги снова.

Хотя Excel представляет собой прекрасную электронную таблицу, это не пакет для статистического анализа данных. Честно говоря, это никогда не было задумано. Имейте в виду, что Data Analysis ToolPak — это «надстройка» — дополнительная функция, которая позволяет вам выполнять несколько быстрых вычислений. Поэтому неудивительно, что это как раз то, для чего он полезен — несколько быстрых вычислений. Если вы попытаетесь использовать его для более обширного анализа, вы столкнетесь с трудностями из-за любого или всех следующих ограничений:

  • Возможные проблемы с анализом недостающих данных.Они могут быть коварными, поскольку неосторожный пользователь вряд ли поймет, что что-то не так.
  • Отсутствие гибкости в анализе, которое может быть выполнено из-за ожиданий относительно организации данных. Это приводит к необходимости вырезать / вставить / отсортировать / и иным образом изменить порядок таблицы данных различными способами, увеличивая вероятность ошибок.
  • Выходные данные разбросаны по множеству разных листов или по одному листу, и вы должны взять на себя ответственность за его разумную организацию.
  • Вывод может быть неполным или может быть неправильно маркирован, что увеличивает вероятность неправильной идентификации вывода.
  • Необходимо повторять запросы на некоторые анализы несколько раз, чтобы запустить их для нескольких переменных или запросить несколько вариантов.
  • Необходимо что-то делать, определяя свои собственные функции / формулы, с сопутствующим риском ошибок.
  • Нет записей о том, что вы сделали для получения результатов, что затрудняет документирование вашего анализа или повторение его позже, если это будет необходимо.

Если у вас более 10 или 12 столбцов и / или вы хотите сделать что-либо, кроме описательной статистики и, возможно, корреляций, вам следует использовать статистический пакет. Есть несколько подходящих, доступных по лицензии сайта через OIT, или вы можете использовать их в любой из компьютерных лабораторий OIT. Если у вас есть Excel на вашем собственном ПК, и вы не хотите платить за статистическую программу, непременно используйте Excel для ввода данных (со строками, представляющими предметы, и столбцами для переменных).Все упомянутые статистические пакеты могут читать файлы Excel, поэтому вы можете выполнять (отнимающий много времени) ввод данных дома и идти в лабораторию для проведения анализа.

Гораздо более подробное обсуждение подводных камней использования Excel с множеством дополнительных ссылок доступно на http://www.burns-stat.com/. Щелкните «Учебники», затем «Зависимость от электронных таблиц».

Чтобы получить помощь или дополнительную информацию о статистическом программном обеспечении, свяжитесь с
Консультационный центр по биостатистике
.Телефон 545-2949

Просмотр статистики книги (Microsoft Excel)

Обратите внимание:
Эта статья написана для пользователей следующих версий Microsoft Excel: 2007, 2010, 2013, 2016, 2019 и Excel в Office 365. Если вы используете более раннюю версию (Excel 2003 или более раннюю), этот совет может не работать для ты . Чтобы ознакомиться с версией этого совета, написанного специально для более ранних версий Excel, щелкните здесь: Просмотр статистики книги.

Excel отслеживает широкий спектр статистических данных о ваших книгах. Эта статистика включает такие банальные и очевидные элементы, как имя файла, каталог и заголовок.Но вы также можете узнать, кто последним работал над книгой, какие ключевые слова связаны с книгой, а также общее время, потраченное на редактирование книги. (Эта последняя статистика — не что иное, как время, когда рабочая книга была открыта.)

Если вы хотите просмотреть статистику для текущей книги, выполните следующие действия, если вы используете Excel 2010 или более позднюю версию:

  1. Откройте вкладку Файл на ленте.
  2. Убедитесь, что в левой части диалогового окна выбрана опция «Информация».
  3. Щелкните ссылку «Свойства» в правой части диалогового окна, а затем щелкните «Дополнительные свойства». Excel отображает диалоговое окно «Свойства» для вашей книги.
  4. Щелкните вкладку Статистика. В диалоговом окне отображается статистика для вашей книги, как уже было описано.
  5. Щелкните вкладку «Сводка», чтобы просмотреть другие статистические данные для своей книги.
  6. Нажмите OK, когда закончите просматривать статистику.

Если вы используете Excel 2007, шаги немного отличаются:

  1. Нажмите кнопку «Office», затем нажмите «Подготовить» и, наконец, «Свойства».Excel отображает некоторые свойства прямо над листом на экране.
  2. Щелкните раскрывающийся список «Свойства документа» и выберите «Дополнительные свойства». Excel отображает диалоговое окно «Свойства» книги.
  3. Щелкните вкладку Статистика. В диалоговом окне отображается статистика для вашей книги, как уже было описано.
  4. Щелкните вкладку «Сводка», чтобы просмотреть другие статистические данные для своей книги.
  5. Нажмите OK, когда закончите просматривать статистику.
  6. Закройте свойства над листом, щелкнув маленький X в правом верхнем углу области свойств.

ExcelTips — ваш источник экономичного обучения Microsoft Excel.
Этот совет (6290) применим к Microsoft Excel 2007, 2010, 2013, 2016, 2019 и Excel в Office 365. Вы можете найти версию этого совета для старого интерфейса меню Excel здесь: Просмотр статистики книги .

Автор Биография

Аллен Вятт

Аллен Вятт — всемирно признанный автор, автор более чем 50 научно-популярных книг и многочисленных журнальных статей.Он является президентом Sharon Parq Associates, компании, предоставляющей компьютерные и издательские услуги. Узнать больше о Аллене …

Отображение широты и долготы

Если вы работаете с географическими данными, вам может потребоваться способ отображения широты и долготы на листе. Этот совет исследует …

Узнать больше

Изменение описания макроса

Частью документирования макросов является предоставление хорошего краткого описания того, что они делают.Изменение описания …

Узнать больше

Поиск пропущенных пробелов перед числами

Если вы хотите вставить в документ пробел между буквами и цифрами, вам нужно выполнить несколько задач. Во-первых, …

Узнать больше

Создание форматирования по умолчанию для книг и листов

Не удовлетворены тем, как книги и листы по умолчанию выглядят в Excel? Вы можете легко создать свои собственные значения по умолчанию…

Узнать больше

Сохранение книги в макросе

Ваш макрос должен гарантировать, что обрабатываемая книга сохранена на диск? Вы можете добавить возможность сохранения …

Узнать больше

Свойства книги печати

Хотите создать печатную запись свойств, связанных с книгой? В Excel нет простого способа сделать это. …

Узнать больше

Формулы Excel: Баскетбольная команда: Статистика игроков

Урок 13: Баскетбольная команда: Статистика игроков

/ ru / excelformulas / percentoff-sale / content /

«Эй! Вот и ты! Я отслеживал баскетбольную команду моей дочери с помощью электронной таблицы…

… и я хочу помочь тренеру вычислить другие статистические данные.Я записал, сколько очков набрал каждый игрок в каждой игре. Не могли бы вы помочь мне выяснить , кто набрал больше всего очков? «

Наша таблица

После того, как вы загрузили нашу электронную таблицу, откройте файл в Excel или другом приложении для работы с электронными таблицами. Вы можете воспользоваться моментом, чтобы увидеть, как организованы данные. Как видите, есть разные строки для каждого из игроков и разные столбцы для количества очков, которые они набрали в каждой игре.

Что мы пытаемся выяснить?

Прежде чем писать формулы, давайте подумаем о проблеме, которую мы пытаемся решить.Наш друг хочет узнать , кто из игроков набрал наибольшее количество очков за эти пять игр .

Написание формулы

Теперь, когда мы знаем, какую функцию использовать, мы начнем с подсчета общего количества баллов, набранных Тони в строке 2.

Прежде чем писать формулу, нам нужно решить, какой диапазон ячеек включить в аргумент.

Теперь мы готовы написать нашу формулу. Перейдите на следующую страницу, чтобы увидеть нашу формулу в действии!

Написание формулы

Теперь, когда мы знаем, какую функцию использовать и диапазон ячеек , мы готовы ввести нашу формулу = СУММ (B2: F2) в ячейку G2:

.

Похоже, Тоня набрала 51 очко.Затем мы перетащим маркер заполнения вниз, чтобы добавить эту формулу для других игроков.

Ну вот! Похоже, Белла набрала больше всего очков. Однако мы могли бы пойти немного дальше, чтобы наши данные действительно выделялись. Например, мы могли бы:

  • Примените условное форматирование , чтобы выделить самые высокие значения
  • Создайте диаграмму для визуального сравнения результатов
  • Сортируйте результаты

В этом случае действительно нет правильного ответа — самое важное — сделать ваши данные понятны и понятны.В этом примере может быть особенно полезно отсортировать данные по общему количеству набранных очков от до — это покажет, кто лучший бомбардир, и упростит ранжирование других игроков в команде. Сортировка работает немного по-разному, в зависимости от того, какую программу для работы с электронными таблицами вы используете:

  • Для Excel 2007-2019 : выберите столбец G, затем щелкните команду Сортировка по убыванию (Z-A) на вкладке Данные .
  • Для Excel 2003 и более ранних версий : выберите столбец G, затем щелкните Данные> Сортировка> По убыванию .
  • Для Google Таблиц : выберите столбец G, затем нажмите Данные> Сортировать лист по столбцу G> По убыванию .

Хорошо, теперь наши результаты действительно легко читать! Мы можем сразу сказать, что Белла является лучшим бомбардиром, и мы также можем ранжировать других игроков.

«Ух ты! Спасибо!

Знаете, я бы хотел подсчитать некоторые другие статистические данные, чтобы я мог рассказать каждому из игроков о том, чего они достигли. Не могли бы вы помочь мне вычислить , сколько очков каждый из игроков забили в своей лучшей результативной игре ? »

Игра, набравшая наибольшее количество очков для каждого игрока

Теперь нам нужно ответить на этот вопрос: сколько очков набрал каждый из игроков в своей самой результативной игре?

Теперь, когда мы знаем, какую функцию использовать, мы начнем с поиска самой результативной игры для Беллы в строке 2.

Прежде чем писать формулу, нам нужно решить, какой диапазон ячеек включить в аргумент.

Перейдите на следующую страницу, чтобы увидеть нашу формулу в действии!

Игра, набравшая наибольшее количество очков

Теперь, когда мы знаем, какую функцию и диапазон ячеек использовать, мы введем нашу формулу = MAX (B2: F2) в ячейку h3 , а затем с помощью дескриптора заполнения добавим ее в другие ячейки. в столбце H.

Теперь мы легко можем увидеть, сколько очков набрал каждый из игроков в своей самой результативной игре!

«Скажите, это просто здорово!

Интересно видеть, что у Хоуп была самая результативная игра, хотя она не набрала больше всего очков в целом.И каждый игрок набрал хотя бы 10 очков в одной из своих игр, чем они все могут гордиться! Не могу дождаться, чтобы показать это команде. Еще раз спасибо! «

/ ru / excelformulas / билеты в кино- / content /

StatTools — набор инструментов для статистики и прогнозирования для Excel

Техническое обслуживание

Планы обслуживания Palisade предназначены для того, чтобы охватить вас, когда будут выпущены новые версии программного обеспечения, или если вам потребуется помощь в работе с программным обеспечением или устранении ошибок.Обновления программного обеспечения часто выпускаются, чтобы соответствовать изменениям в Windows, Excel или других основных приложениях. Обновления также могут включать исправления ошибок или незначительные улучшения продукта. Обновления основных версий выпускаются, когда в программное обеспечение вносятся новые существенные новые функции и / или изменения интерфейса. Обновления основной версии могут также включать обновления совместимости хост-приложений. Техническая поддержка также включена в обслуживание Palisade. Palisade всегда готов помочь с установкой, операционными проблемами или сообщениями об ошибках, будь то через самоподдержку с помощью нашей базы знаний, по электронной почте или по телефону.

Преимущества планов обслуживания Palisade

Бесплатная техническая поддержка по горячей линии или по электронной почте. Время работы службы технической поддержки

Понедельник — пятница, 4:00 — 17:00

(Часовой пояс Нью-Йорка). Техническая поддержка доступна для установки программного обеспечения, устранения ошибок программного обеспечения, помощи в работе программного обеспечения и ограниченного устранения ошибок модели. Техническая поддержка не предназначена для создания моделей электронных таблиц с нуля, обширной отладки моделей или обучения программному обеспечению.Эти услуги можно получить в нашем отделе обучения и консультирования.

  • Бесплатные обновления полной версии.
  • Неограниченное количество инцидентов на 12 месяцев.
  • Неограниченный круглосуточный доступ к базе знаний онлайн-поддержки Palisade — тот же источник, который используют сотрудники службы технической поддержки Palisade. Быстрая проверка базы знаний часто решает проблему всего за несколько минут.
  • Гарантированное время ответа службы технической поддержки 24 часа или на следующий рабочий день.
  • Бесплатные обновления и исправления программного обеспечения, включая исправления ошибок и обновления совместимости с Windows / Office.
  • Доступ к онлайн-службе поддержки Palisade 24 часа в сутки, чтобы вы могли отправлять новые инциденты и проверять статус открытых проблем.

Легко заказать

При покупке программного обеспечения включено обслуживание в течение всего года. Незадолго до истечения срока действия вашей подписки к бессрочной лицензии уведомления о продлении будут отправлены по электронной почте.Если вы решите не продлевать подписку к бессрочной лицензии, ни одно из перечисленных выше преимуществ не будет вам доступно. Просроченные планы обслуживания могут быть продлены только по более высоким ценам и с уплатой платы за восстановление.

Чтобы заказать или продлить подписку на обслуживание, свяжитесь с:

607-277-8000

тел

800-432-7475

бесплатно в США / Канаде

607-277-8001 факс