Шрифт:
Интервал:
Закладка:
Конечно, самое простое — выкрасть нужную информацию из чужого сейфа.
Но столь пошлая вещь не для такой правильной братвы, коей мы с вами, орлы и орлицы, имеем честь являться.
Во-первых, зачастую нужной нам информации нет даже в хранилищах Гохрана.
А во-вторых, из открытых источников сведения получаешь гораздо быстрее, чем из закрытых (таков парадокс современного постиндустриального информационного общества).
При работе с открытыми источниками (периодическая печать, телек и все такое) возникает проблема выборки — на каком количестве сообщений остановится и с какой по какую дату их изучать.
Чем больше будет всякой байды, тем больше времени потребуется для того, чтобы загнать всю эту смурную шнягу в нутро компьютера.
Эти параметры выборки определяются задачами и масштабами исследования.
Необходимым его условием является разработка таблицы-вопросника — основного рабочего документа, с помощью которого проводится исследование.
Без нее контентолог — никто и ничто, без папки с этими таблицами его надо гнать из приличного общества пинками по колышущемуся, аки медуза-гигант на борту попавшей в шторм рыболовецкой шхуны, пухлому заду.
Такая таблица внешне напоминает анкету: каждый вопрос предполагает ряд признаков (ответов), по которым садистки-жестоко дербанится содержание текста.
Для регистрации же единиц анализа составляется другая таблица — кодировальная матрица.
Если объем выборки достаточно велик (свыше 100 единиц), то кодировщик, как правило, работает с толстой пачкой матричных листов, заляпанных разводами приднестровского портвейна, измазанных волынским салом и покрытый кусочками мелко нашинкованного кубанского лука.
Процедура подсчета при количественном контент-анализе проста, как бином Ньютона.
Возьмем, к примеру, формулу вычисления коэффициента некоего Яниса (не путать с Янусом и с анусом!), предназначенную для того, чтобы узнать соотношение положительных и отрицательных оценок товара, который мы отрекламировали по полной программе, вкатив в рекламную кампанию немыслимое количество бабок.
В случае, когда число положительных оценок товаров или услуг после рекламы превышает число отрицательных, считаем так: С=(a2-ab)/de.
Тут «a» — это число положительных оценок; «b» — число отрицательных оценок; «d» — объем содержания текста, имеющего прямое отношение к изучаемой проблеме; «e» — общий объем анализируемого текста.
В случае, когда число положительных оценок меньше, чем отрицательных, считаем иначе: С = (ab-b2) / de.
Построенная на изменении полученных чисел диаграмма больше, чем все горластые рекламщики, покажет клиенту, каким же он был идиотом, поведясь на увещевания акул из агентства.
Есть и более простые способы измерения.
К примеру, удельный вес той или иной ключевой для нас фразы (слова) можно вычислить с помощью формулы: Е=f/g, где f — число единиц анализа, фиксирующих данную категорию, а g — общее количество единиц анализа.
А теперь 6 бесплатных советов по контент-анализу, открытых мне одним контентологом под страшными пытками:
№ 1. Качественный или количественный анализ нам нужен?
Количественный контент-анализ в первую очередь интересуется частотой появления в тексте определенных характеристик (переменных) содержания.
Например, нам нужно узнать, чем интересуется немецкая пресса, чьи читатели — пивуны-привереды (в смысле — любят пиво качественного разлива).
И чего мы делаем? Мы берем первую сотню наиболее часто упоминаемых в этой прессе словечек. Отсеиваем к чертовой бабушке всякую байду вроде: "Биттэ-дриттэ, хенде-хох!", "Хитлер капут, русише швайне!" и прочие «данкешоны». Оставляем только то, что связано с предпочтением тех или иных сортов пива и закуси к нему (это прозвучит дико, но так оно и есть на самом деле: несчастная немчура не знает вкуса сушеной воблы, не умеет правильно разбавлять пиво шнапсом и поэтому уже какой век мечется в поисках лучшей выпивки и закуски). И считаем-считаем-считаем…
И вот таким банальным способом мы, дорогие мои братцы и сестрицы, и вылавливаем еще не окученный конкурентами сегмент на рынке пивных услуг.
Качественный же контент-анализ позволяет делать выводы даже на основе единственного присутствия или отсутствия определенной характеристики содержания.
№ 2. Что такое простые частоты?
Это подсчет частот появления в текстах различных слов или тем.
Например, если мы видим в статье "наш любимый Василь Василич Пупкин", значит, это статья на его бабки.
Если — просто "уважаемый всем народом лидер", значит — на бабки его спонсоров.
Если же без пиетета — «Пупкин» или "политический деятель", значит — на бабки органов местного самоуправления.
Если "душитель свободы" и "кровавый бандит" значит, на членские взносы радикально-оппозиционной антипупкинской партии.
№ 3. А что есть относительные частоты?
Однако просто частота появления того или иного слова или темы мало что говорят. Гораздо более информативны не абсолютные, а относительные частоты, которые вычисляются как отношение абсолютной частоты к длине анализируемого текста.
В зависимости от того, что является переменной содержания, под длиной текста может пониматься количество слов в нем, количество предложений, абзацев и пр.
№ 4. Надо ли применять базовые частоты?
Естественно!
Например, депутаты Госдумы ругают Правительство.
Это мода такая.
И если нам поступил заказ, проверить, насколько удачны пиар-действия лоббистов по свержению нынешнего кабинета министров, то глупо браться за тексты выступлений депутатов и оценивать по их агрессивности скорость роспуска команды премьера.
Надо взять в качестве образца тексты (изготовить, так сказать, "частотные словарики") прежних депутатских выступлений. И сделать на их основе таблицу с базовыми частотами употребления приготовленных нами для исследований единиц анализа (например, криков: "Долой!" или "В отставку раздолбаев!").
И тогда — сравнивая результаты теперешних выступлений с базовыми, мы поймем насколько они действительны агрессивны.
Отклонение частот вычисляют по формуле: h-j/i.
Тут у нас: h — количество слов данной категории, реально встретившихся в тексте, j — ожидаемое число вхождений слов данной категории в текст, а i — стандартное отклонение.
Величина j вычисляется путем умножения нормальной частоты категории на число слов в анализируемом тексте.
Представим, что мы хотим оценить степень агрессивности выступления не депутата, а профессионального военного.
Очевидно, что норма для него будет отличаться от нормы для среднего человека.
Поэтому для оценки уровня агрессивности профессионального военного требуются другие нормы, которые могут быть получены путем дополнительной статистической обработки представительной выборки текстов, характерных для контуженных солдафонов и отчаянных рубак-тыловиков.
№ 5. Как связать нужный веник из разных категорий?
Представьте, что нам нужно из сведений, почерпнутых из строк залитой кровью странички (исповеди покупателя клюшек для гольфа, забитого продавцами данных клюшек насмерть этими же самыми распроклятыми клюшками), сделать далеко идущие выводу по поводу потребления в Намибии русских дубленок из турецкой кожи.
Такая задача по плечу только самым ушлым из контентологов.
Решая ее, они обращают внимание на совместную встречаемость слов различных категорий.
Может оказаться, что для некоторых категорий наблюдается тенденция их совместного употребления, а для других — наоборот.
В качестве гипотетического примера можно привести газетную статью, в которой наблюдается совместное употребление категорий «сволочи», «водка» и «чиновники».
Путем несложных вычислений легко понять, что газетная заказуха была проплачена водочными баронами, недовольными повышением госакцизов на спиртное и скоро во властных коридорах начнутся петушиные бои между водочными и винными лоббистами.
№ 6. Что такое контекст и подтекст?
Иногда различают слова «бэкграунд» и «контекст». Я же считаю, что такое различение не имеет смысла.
Бэкграунд, на мой взгляд, это и есть контекст. Просто «бэкграунд» слово настолько красивое, что его все чаще и употребляют, где не попадя.
А подтекст — он подтекст и есть. Бывает его обзовут каким-нибудь лишайным «сollocations». Но наш русский подтекст, он всем подтекстам подтекст. В нем столько всего для сердца русского слилось, что какой-нибудь турок с ума сойдет и начнет кидаться апельсинами в полицейских, а так и не разгадает нашей российской многосмысленности непроизносенного.
- Священная коммерция. Бизнес как путь пробуждения - Мэтью и Терсес Энгельгарт - Психология
- Управление конфликтами в корпоративных структурах региона (на примере Республики Дагестан). Магистерская диссертация по направлению 080507 (65) «Менеджмент» - Гасан Магомедов - Психология
- Формирование будущих событий. Практическое пособие по преодолению неизвестности - Ирина Штеренберг - Психология
- Как поиметь мир. Настоящие техники подчинения, влияния, манипулирования - Вадим Шлахтер - Психология
- Техники семейной терапии - Сальвадор Минухин - Психология
- UPGRADE по-римски. Руководство для варваров - Марк Сидоний Фалкс - Психология
- Самовлюбленные, бессовестные и неутомимые. Захватывающие путешествия в мир психопатов - Джон Ронсон - Психология / Публицистика
- Увлеченность работой. Как научиться любить свою работу и получать от нее удовольствие - Питернель Дийкстра - Психология
- Антропология экстремальных групп: Доминантные отношения среди военнослужащих срочной службы Российской Армии - Константин Банников - Психология
- Работа собой - Полина Гавердовская - Психология