Стандартное отношение куки-файлов к «посетителям»?

Как отмечено в недавнем сообщении в блоге , мы видим большое расхождение между посетителями Google Analytics и посетителями «Quantcast».

  

Кроме того, по причинам, которые мы никогда не выясняли, Google Analytics просто получает больше номеров, чем Quantcast. Сейчас GA показывает больше посетителей (15 миллионов) только на stackoverflow.com, чем Quantcast видит по всей сети (14 миллионов):

     

http://blog.stackoverflow.com/wp-content/uploads/GA-Visitors1 .png

     

Почему? Я не знаю. Либо Google Analytics иногда теряет файлы, либо Quantcast пропускает посетителей. Подсчет - это неточная наука.

Мы считаем, что это связано с тем, что Quantcast использует более консервативное соотношение cookie-to-visitors . Принимая во внимание, что Google Analytics может считать каждый cookie «посетителем», Quantcast будет рассматривать только каждый 1.24 cookie «посетитель». Это имеет смысл для меня, так как люди могут получить доступ к нашим сайтам с нескольких компьютеров, нескольких браузеров и т. Д.

У меня есть два тесно связанных вопроса:

  1. Есть ли принятое стандартное отношение куки-файлов к посетителям? Это, очевидно, неточная наука, но существует ли какое-либо новое правило?

  2. Есть ли более точный способ подсчета «посетителей» на веб-сайте, кроме как полагаться на файлы cookie браузера? Или это просто всегда будет как-то лучше всего оценивать crapshoot независимо от того, как вы его измеряете?

31 голос | спросил Jeff Atwood 14 PMpThu, 14 Apr 2011 13:51:09 +040051Thursday 2011, 13:51:09

6 ответов


14

Quantcast отправил мне по электронной почте:

  

Вы упомянули, что между вашими номерами GA и вашими номерами QC была довольно значительная разница. Хотя это часто случается, это происходит, и это может быть несколько причин. Например, мы учитываем сторонние файлы cookie и автоматическое обновление, а GA - нет. Мы также просим, ​​чтобы издатели разместили наш тег в нижней части страницы, чтобы соответствовать стандартам MRC и IAB. Если ваши другие теги измерений выше на странице, они могут срабатывать, когда Quantcast не делает этого. (Мы являемся единственной аккредитованной службой измерения трафика MRC). Кроме того, цифры никогда не будут одинаковыми из-за соображений часового пояса - мы используем нормирующую функцию, и GAâ € ™ s фиксирован.

     

Если вы хотите узнать больше о том, как мы определяем наши номера, пожалуйста, проверьте: http: //www .quantcast.com /как-мы-сделай . У нас также есть официальные документы о наших данных, скорректированных с помощью cookie, и наша методология, расположенная здесь.

Просматривая белые бумаги, я вижу, что они на самом деле делают то, что предлагает Джефф: подталкивая «официальные» цифры, чтобы получить то, что, по их мнению, ближе к истинному числу людей. У них есть Белая книга с исправленной публикацией cookie (ссылка в формате PDF) что их система довольно сложная, не такая простая, как просто деление на магическое число:

  

Программа Quantcast Quantified Publisher захватывает более 75 миллиардов медиа   каждый месяц, генерируемые более чем 1,4 миллиардами куки-файлов (данные по состоянию на июнь 2008 года). Whatâ € ™ s   Более того, многие из наших партнеров Quantified Publisher совместно используют анонимные идентификаторы, которые не зависят от   печенье. Наша модель также включает в себя несколько панелей, которые обеспечивают ориентированные на людей опорные точки и калибровку   которые не содержат удаления файлов cookie. Мы триангулируем по этой массе данных с различными процессами сбора,   предубеждениями и проблемами. Наши модели учитывают частоту посещения, временные периоды, вероятность множественности   использование компьютера и даже влияние нескольких людей, использующих один и тот же компьютер, для доставки людей на основе   По оценкам.   Наша модель для перевода уникальных файлов cookie для людей была проверена с использованием пробных образцов и независимых   наборы данных. Кроме того, наша модель динамична и повторно откалибрована на постоянной основе, чтобы отразить меняющийся характер   Интернет-трафик.

ответил Joel Spolsky 15 AMpFri, 15 Apr 2011 04:28:35 +040028Friday 2011, 04:28:35
27

Есть еще один фактор, который играет с подсчетом Quantcast: они используют сторонние файлы cookie (файлы cookie, которые отправляются из домена .quantserve.com ), тогда как в Google Analytics используются файлы cookie сторонних производителей ( stackexchange .com и т. д.)

Это очень важно, так как некоторые браузеры (особенно Safari, но совсем недавно Firefox и Chrome) отключили сторонние файлы cookie как настройки по умолчанию, и многие другие могут индивидуально выбирать параметры конфиденциальности, которые запрещают сторонние куки. Это означает, что есть подмножество населения, которое никогда не будет отслеживаться куки QuantCast. Вследствие этого Google Analytics всегда будет возвращать более высокий счет посетителя.

Я бы сказал, что эмпирическое правило не существует. Как специалист по аналитике, я бы сказал, что поиск «истинного» посетителя является безнадежным, и вместо этого сосредоточиться на самих посещениях. Например, в вашей учетной записи Google Analytics у меня, по крайней мере, 8 разных посетителей, вы получили доступ к StackOverflow из Chrome, Safari и Firefox на моем рабочем ноутбуке, моем личном ноутбуке, телефоне и iPad. Все сервисы Google Analytics подсчитываются по-разному, и, следовательно, все возвращают значительно разные номера.

Даже с идеальной реализацией Google Analytics почти всегда будет показывать меньшее количество посещений, чем система аналитики на основе сервера, но будет показывать более высокий рейтинг посещения, чем сторонняя система на основе cookie, такая как Quantcast. Важно не смотреть на исходные итоги, а на тенденции, которые каждый метод показывает в своих сильных сторонах. Поэтому никогда не сравнивайте номера Quantcast с номерами Google Analytics; вместо этого используйте числа в контекстах, в которых они были собраны.

Еще одна проблема может заключаться в том, что ваша реализация Google Analytics неверна, поскольку настройка ее для настройки типа нескольких доменов и поддоменов может быть кошмаром, если не сделано правильно и строго, что может привести к созданию единого браузера считая нескольких посетителей, сам раздувая ваш счет. Это никогда не проблема для Quantcast, так как все файлы cookie устанавливаются в домене сторонних производителей.

ответил Yahel 14 PMpThu, 14 Apr 2011 16:25:23 +040025Thursday 2011, 16:25:23
7

Отношение куки-файлов к уникальным посетителям обычно составляет от 1,3 до 1,7 для сайтов с более чем миллионом посещений.

В то время как yc01 правильно, что GA использует сторонние файлы cookie против сторонних файлов cookie, мы на RealSelf.com используем два независимых поставщика аналитики (GA и Comscore Direct), а GA по-прежнему показывает на 30% больше абсолютных уникальных посетителей, чем Comscore's Уникальные посетители.

Comscore показывает только уникальных посетителей по странам, поэтому, чтобы сравнить GA с Comscore, мы должны вычислить количество уникальных посетителей, основанных на США, следующим образом:

Посещения США /глобальные визиты * Абсолютные уникальные пользователи

(1,150,110 /1,650,979) * 1,273,059 = 886,842 уникальных пользователей в США

В отличие от этого, Comscore сообщает о 680 900 уникальных пользователей в США. Таким образом, GA показывает на 30,2% больше.

Comscore построил свой бизнес, пытаясь быть точным, в то время как GA - это прежде всего бесплатный способ отслеживать и оптимизировать сайты, использующие AdWords и AdSense. В Comscore есть группа людей, которую они также используют для оценки трафика, и они используют эту панель для определения среднего количества файлов cookie на человека. С большим количеством людей, использующих мобильные устройства (наше мобильное использование составляет 15%), имеет смысл, что уникальные файлы cookie преувеличивают число уникальных людей.

ответил Eric K 14 PMpThu, 14 Apr 2011 22:02:26 +040002Thursday 2011, 22:02:26
4

Вот недавний (4 мая 2011 года - вчера, когда я пишу это) исследование от MediaMind с помощью «Множителей инфляции Cookie» для разных рынков:

Их расчетный коэффициент инфляции составляет от 2,2 для Германии до 3,0 для США.

ответил Theo 5 Maypm11 2011, 19:45:49
2

Возможно, ваши номера посетителей GA более завышены, чем обычный сайт из-за более технического характера его аудитории? Например, программисты, особенно веб-разработчики, чаще используют ряд браузеров и, таким образом, увеличивают количество файлов cookie.

Для вопроса 1, я думаю, что, как и во многих показателях, лучше использовать данные с вашего собственного сайта, а не искать глобальные стандарты, поскольку агрегаты могут вводить в заблуждение. Один из способов получить куки-файл для реального подсчета посетителей может состоять в том, чтобы подсчитать, сколько файлов cookie вы видите у каждого зарегистрированного пользователя, а затем вывести число из этого.

Что касается числа 2, теоретически лучшим способом подсчета реальных посетителей было бы заставить всех регистрировать учетную запись. Поскольку это, очевидно, не очень хорошая идея, вы можете посмотреть на нормализацию. Например, вы можете использовать средний куки-файл для зарегистрированного пользовательского показателя, который я предложил выше, и применить его к номерам посетителей, которые GA сообщает.

ответил Ewan Heming 15 AMpFri, 15 Apr 2011 06:22:34 +040022Friday 2011, 06:22:34
-1

Я думаю, что IP доверяет ... когда я создаю статистическую систему типа GA с помощью python, я использую какой-то метод вроде этого

  • отправить cookie в браузер и захватить все данные агента в базу данных
  • простой способ, если новый визит имеет cookie, это не новое посещение, поэтому я сохраняю его как не новое посещение (также я назначил дату и время задержки для поиска нового посещения, если пользователь повторил посещение сайта через 2 часа).
  • сохранить пользовательский IP-адрес и некоторый идентификатор для этого пользователя, а также IP-адрес и файл cookie (его сохранение также в файле cookie)
  • Новый пользователь приходит и не имеет cookie ... это новый IP-адрес? да? ОК его новый пользователь только захватить пользовательский агент и IP /нет? сколько раз этот пользователь приходит? больше предела? не совсем новый визит, не больше с этим пользовательским агентом? OK это новое ...: D

этот метод имеет ошибку, но неплохо и почти достоверные данные ... (его также зависит от времени задержки, чтобы найти нового пользователя (задержка между двумя посещениями) и попробовать время для пользователей, не имеющих cookie)

ответил Mohammad Efazati 14 PMpThu, 14 Apr 2011 17:42:11 +040042Thursday 2011, 17:42:11

Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132