Знай свое дело

Контент-анализ: сущность, задачи, процедуры. Контент-анализ Типы информационных массивов и единицы контент-анализа

1. ТИПЫ ИНФОРМАЦИОННЫХ МАССИВОВ И ЕДИНИЦЫ КОНТЕНТ-АНАЛИЗА

Основа контент-анализа – это подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными иными количественными или качественными характеристиками. Отсюда понятно, что главная предпосылка контент-анализа – это выяснение того, что считать; иными словами, определение единиц анализа. Единицы эти в зависимости от целей анализа, типа информационного массива, а также ряда дополнительных причин могут быть (и реально бывают) весьма разнообразными. К ним предъявляются два естественных, но, к сожалению, обычно плохо совместимых требования. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте; в идеале хотелось бы, чтобы их выявление вообще могло быть алгоритмизовано. Понятно, что такому требованию лучше всего удовлетворяют формальные элементы текста или же элементы, имеющие четко выраженные и однозначные формальные соответствия, например слова. С другой стороны, от единиц контент-анализа чаще всего требуется некая субъективная, да к тому же еще и зависящая от контекста значимость, делающая их распределение и динамику такого распределения диагностичными для выявления изменений в индивидуальном и общественном сознании, системах убеждений и т.д. – иными словами, единицы должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации. Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими разнообразными способами. Их идентификация в общем случае предполагает семантический анализ текста, проблема автоматизации которого, несмотря на многолетние усилия лингвистов и программистов, далека от решения. Характеристику единиц контент-анализа необходимо предварить кратким соображением о природе анализируемого информационного массива. В самом определении метода контент-анализа нет ничего, что препятствовало бы применению его к отдельно взятому тексту; более того, примеры такого анализа известны. Тем не менее существует ряд причин, по которым объектом контент-аналитических проектов обычно является не отдельный текст, пусть даже значительный по объему, а именно информационный массив, или информационный поток, состоящий из большого количества текстов. Во-первых, статистические закономерности проявляются тем более отчетливо, чем больше объем выборки. Во-вторых, большинство целей контент-анализа предопределяют его тяготение к компаративности; аналитиков чаще всего интересуют не одномоментные срезы, а динамика изменений, а если и срезы, то, как правило, «пестрые», отражающие, например, различные СМИ или сознание различных социальных групп. Наконец, при всем разбираемом ниже разнообразии единиц контент-анализа наиболее популярными являются различные макроединицы: темы и/или проблемы, пропозиции, образы и идеологемы. Таковых в отдельно взятых текстах и особенно в небольших по объему текстах СМИ обычно немного, да и новые макроединицы появляются не столь часто, поэтому оценить их динамику можно лишь на большом временном промежутке или при широком «горизонтальном сопоставлении». Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных слоганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени. Конкретное разнообразие единиц контент-анализа практически безгранично, однако среди них можно выделить несколько основных типов. (Классификация, приводимая ниже, построена с учетом типологии К.Криппендорфа, однако отличается от нее весьма существенно.)

1.1. «Физические» единицы. Под таковыми понимаются сущности с четко очерченными физическими, геометрическими или временными границами, как, скажем, экземпляры книги, номера газет, экземпляры плакатов или листовок, фотографии и т.п. Идентификация и подсчет их не составляют особого труда, однако необходимость в таком подсчете возникает достаточно редко; подсчет, скажем, листовок или книг чаще всего осуществляется с целью оценки представленности какой-то тематики или оценки, т.е. реально используются единицы других, характеризуемых ниже типов единиц – обычно концептуальных, пропозициональных или тематических.

1.2. Структурно-семиотические единицы. Под таковыми имеются в виду основные элементы семиотических систем (см. СЕМИОТИКА). В случае естественного языка это:

– лексика языка (слова и их эквиваленты, например выражение железная дорога или термин контент-анализ, т.е. то, что фиксируется в словарях) и

– грамматические показатели (например, отрицательные частицы или показатели таких категорий, как, скажем, отглагольные имена).

Количественный подсчет встречаемости слов в тексте – это, пожалуй, самый простой вариант контент-анализа, который, однако, зачастую способен давать небезынтересные результаты. Чаще всего, конечно, подсчитываются «интересные», или «ключевые» слова и/или словосочетания, например названия ценностных категорий типа свобода, стабильность, доверие, территориальная целостность; сценариев типа предательство или разочарование; достаточно однозначные обозначения тех или иных общественно значимых явлений, например коррупция, преступность или терроризм; значимые атрибуты наподобие жесткий, решительный; эмоционально окрашенная оценочная лексика типа разрушительный, неудержимый, подлый, кошмарный, человеконенавистнический; слова-пароли (тоже зачастую эмоционально окрашенные) типа патриоты, коммунофашисты, мондиалисты или белопридурки; слова, сильно активизированные в конкретный момент времени, вроде «Семья» или «Мабетекс» в начале осени 1999 или все та же «Семья» и «Медиа-Мост» в конце весны 2000 в России, терроризм во множестве стран мира осенью 2001 и т.д.

Контент-анализ грамматических категорий представляет собой достаточно редкое исследовательское начинание, стимулом к которому является гипотеза (весьма правдоподобная) о том, что употребление грамматических форм в меньшей степени, чем употребление лексики, контролируется автором текста и поэтому может послужить источником таких сведений о нем, которые он сам вовсе не собирался делать доступными своим читателям. В политической психологии существует специальная исследовательская методика, так называемый анализ когнитивной сложности, которая на основе фактически контент-аналитической процедуры позволяет делать выводы о том, насколько простым (или, напротив, сложным) является видение политической ситуации автором текста и как оно меняется со временем. Единицами контент-анализа, лежащего в основе оценки когнитивной сложности, являются, например, относимые обычно к служебной лексике категорические квантификаторы типа всегда, никогда, всякий, которым противостоят квантификаторы типа иногда, некоторый и т.п.; категорические (вроде знаменитого однозначно) оценки истинности в противоположность осторожным возможно или не исключено, что; языковые средства дифференцированного рассмотрения ситуации наподобие с одной стороны... с другой стороны; упоминания взаимодействия, баланса, взаимозависимости, компромисса и т.д. Известны и примеры контент-анализа чисто грамматических средств, например исследования соотношения глагольных форм, обозначающих, соответственно, процессы и результаты, исследование номинализованных (с отглагольными именами типа построение, усиление и т.п.) конструкций в языке партийных документов брежневского времени, отрицания в политическом тексте и др. Поскольку объектами контент-анализа могут быть не только вербальные (естественноязыковые), но и другие виды текстов (например, карикатуры, фотоснимки, рекламные клипы), постольку в числе структурно-семиотических единиц контент-анализа могут присутствовать визуальные и звуковые (чаще всего музыкальные) образы и символы, которые могут анализироваться на тех же основаниях, что и единицы естественного языка.

1.3. Понятийно-тематические единицы. В большинстве случаев контент-аналитик интересуется не словами как таковыми и тем более не грамматическими категориями, а стоящими за словами значимыми для него понятиями, темами, проблемами – иными словами, тем, что можно назвать понятийно-тематическими единицами. Исследователь, интересующийся тем, какое место в общественном сознании занимает, скажем, проблема преступности, обязан принимать во внимание не только присутствие в анализируемом информационном массиве слова преступность, но и упоминания заказных и всяких прочих убийств, бандитского беспредела, «крыши», «братков», авторитетов, власти криминала и проч. Тот, кого занимает проблема свободы, должен в своем анализе реагировать на упоминания давления на прессу, чиновничьего произвола, контролируемости СМИ, доступа к Internet и т.д. Интересующийся отношением общественного сознания к каким-то реалиям должен принимать во внимание самый широкий спектр позитивных, негативных и некоторых более конкретных оценок, которые могут быть даны этим реалиям, причем эти оценки вовсе не обязательно должны присутствовать в виде оценочных суждений.

1.4. Референциальные и квазиреференциальные единицы. К референциальным, точнее, конкретно-референциальным единицам относятся обозначения реальных личностей (как современных, так и исторических деятелей), событий, городов, стран, организаций и т.д.; это, так сказать, «энциклопедический» блок единиц анализа. Этот блок, особенно в части персоналий, весьма важен и диагностичен, поскольку позволяет определять личностные рейтинги и, что не менее существенно, оценивать идеологические системы с точки зрения присутствующих в них референтных «знаковых» фигур, своего рода «идеологических героев». Примером интересного исследования роли референтных фигур в российском оппозиционном дискурсе 1996–1997 может послужить работа А.В.Дуки. Способы обозначения в тексте конкретных фигур могут различаться (В.В.Жириновский, Владимир Вольфович, Вольфыч, Жирик, сын юриста, лидер ЛДПР, самый провосточный российский политик, главный либеральный демократ, либералиссимус), однако конкретно-референтная единица здесь во всех случаях одна. Квазиреференциальные единицы в политических текстах чаще всего бывают представлены обозначениями всякого рода «сил» – коллективных актеров политической сцены, референция которых может колебаться от реальной (типа КПРФ) через обобщенную (коммунисты, либералы, Запад, исламисты) к откровенно мифологизированной (мировая закулиса). Независимо от своей референции все эти персонажи присутствуют в идеологическом пространстве, им могут приписываться действия и оценки, и отношение к ним является немаловажным политико-идеологическим фактором. Грань между квазиреференциальными и некоторыми типами понятийно-тематических единиц размыта в силу того, что некоторые политические понятия способны и даже склонны (например, та же преступность) к метафорической персонификации. 1.5. Пропозициональные единицы и оценки. Их примеры приводились выше – Карфаген должен быть разрушен или Россия задыхается без инвестиций. Собственно говоря, это примеры высказываний, в основе которых лежат пропозиции – описания конкретных положений дел (ситуаций) безотносительно к их модальности (в первом примере – требование, во втором – констатация). Наряду с пропозициями для контент-анализа могут представлять (и очень часто представляют) большой интерес оценки (Это очень опасное решение). С логической точки зрения они обладают важными отличиями от пропозиций, однако для целей контент-анализа как собственно пропозиция, так и оценка могут рассматриваться как результат связывания некоторого объекта с некоторым атрибутом. Изучение динамики оценочных суждений, высказываемых в адрес тех или иных лиц, событий, институтов, – весьма распространенный тип контент-аналитического исследования.

1.6. Макроструктурные единицы. Под макроструктурными единицами понимаются достаточно сложные понятийные конструкции, образующие «верхние этажи» человеческих представлений о мире и, в частности, идеологических систем. Эти конструкции, как правило, носят характер сценариев и описывают стереотипные модели развития, с которыми сопряжены ожидания будущего, соображения о прошлом, эмоциональные ассоциации и т.д. Часто эти конструкции имеют литературные или фольклорные прототипы, что отражается в их названиях. Все они в очень сильной степени претендуют на объяснение действительности. Для обозначения таких конструкций чаще всего используется термин «идеологема»; в различных дисциплинах говорят также о мифологемах, кочующих образах и т.д. Среди подобного рода конструкций, присутствующих в общественном сознании современной России (и распределенных, порою причудливо, по разным идеологическим системам), имеются, например, следующие: Заговор, Оргия коррупции / Криминальная революция / Беспередел, Ограбление / Конверсия власти в собственность, Страна дураков / Город Глупов, «Нет, ребята, все не так», «Возвращение в цивилизацию» и др. Некоторые еще недавно значимые идеологемы (скажем, Борьба за власть, Естественный распад или Тотальная некомпетентность) в последние полтора-два года по различным причинам вышли из фокуса внимания средств массовой информации, а отчасти и населения.

1.7. Единицы, представляющие результаты концептуальных операций. Их довольно много, однако наибольший интерес для контент-анализа представляют метафоры, примеры и аналогии, которые в общем плане уже были охарактеризованы выше. Некоторые из метафор активно используются в политических текстах, и их использование считается диагностичным для характеристики как индивидуального сознания автора текста, так и состояния общественного сознания. Например, в политических текстах часто встречается упоминавшаяся «военная метафора» в варианте ПОЛИТИЧЕСКОЕ ПРОТИВОСТОЯНИЕ – ЭТО ВОЙНА, проявляющаяся в таких выражениях, как война с бедностью, удар по губернатору, атака со стороны оппозиции, разгромная публикация и т.д. При использовании такой метафоры политическое противостояние, независимо от того, в какой форме оно реально ведется, переживается как война, что может, кстати, иметь последствия и для реальных форм политического взаимодействия. Между тем «военная метафора» – это не единственный способ описания политического процесса (и, шире, жизни вообще); они могут описываться с помощью, например, «транспортной метафоры» и/или связанной с ней «метафоры пути» (Мы все вместе вступили на трудную дорогу), «архитектурной метафоры» (государственное строительство, выстраивание властной вертикали) и ряда других. Метафорика политических текстов достаточно подробно изучалась Дж.Лакоффом и его последователями, в том числе и в рамках контент-аналитической методологии (работы А.Н.Баранова); было показано, что, например, возрастание частотности военной метафоры является одним из коррелятов усиления напряженности в обществе.

Не менее диагностичным может быть исследование динамики примеров и аналогий – так, в российских политических текстах до недавнего времени настойчиво повторялась аналогия (принадлежащая В.Янову), в рамках которой Россия сравнивалась с Веймарской республикой.

1.8. «Поэтические» единицы. Под таковыми имеются в виду допускающие количественное измерение средства художественной выразительности – например, каламбуров, аллитераций и т.п.


2. ЧАСТОТНЫЕ И СИСТЕМНЫЕ ХАРАКТЕРИСТИКИ В КОНТЕНТ-АНАЛИЗЕ

2.1 Единицы, категории и признаки. При том, что контент-анализ является в своей основе количественным методом, в нем, как уже говорилось, почти всегда присутствует и значительная качественная составляющая. В принципе это верно уже постольку, поскольку единицы контент-анализа, как видно из предыдущего раздела, чаще всего все же являются содержательными и их выделение основывается на семантических (смысловых) критериях; многие из единиц представляют собой обобщенные категории (это относится прежде всего к темам и идеологемам). Иными словами, контент-аналитик занимается количественным анализом качественных категорий. Но этим дело не исчерпывается. Во многих контент-аналитических проектах осуществляется не только оценка степени представленности в тексте тех или иных единиц, но и одновременная оценка этих единиц по тем или иным градуированным качественным шкалам. В частности, это могут быть предложенные Ч.Осгудом шкалы абстрактности (фактически – трудности для восприятия) того или иного содержания; расстояния до индивидуума (какие-то содержательные компоненты могут непосредственно касаться читателя или читателей, а какие-то могут представлять лишь досужий интерес). В сочетании с результатами собственно контент-анализа оценка использованных единиц анализа (тематических) по указанным шкалам дает трехмерную схему типа, например, той, что была предложена французским культурологом А.Молем. Очевидно, что при анализе могут быть использованы и другие шкалы, кроме того, единицы контент-анализа могут объединяться в различные более широкие категории.

2.2 «Фронтальный» и «рейдовый» контент-анализ. Контент-аналитические исследования можно разделить на два больших класса, которые, пользуясь вышеупомянутой «военной метафорой», можно назвать фронтальными и рейдовыми. Задачей фронтального контент-аналитического исследования является составление максимально более полного представления об информационном потоке – либо на моментальном срезе, либо на протяжении некоторого периода с целью оценки динамики. Это, так сказать, попытка получить объективизированный ответ на вопрос «Что пишут?» Единицы такого анализа в принципе могут быть любыми, но чаще всего в таковом качестве выступают либо тематические единицы, либо ключевые слова, реже оценки и пропозиции и еще реже макроструктурные единицы. Такой анализ обычно носит сугубо прикладной характер и ведется в режиме мониторинга. Поскольку целью его является составление общего представления о содержании СМИ и через него – об общественном сознании, он должен в идеале стремиться к возможно более широкому охвату информационного потока. На практике, однако, полный охват чаще всего бывает невозможен, да зачастую и не нужен. Тем самым на повестку дня контент-аналитического исследования встает проблема составления репрезентативной выборки – традиционная проблема эмпирического социологического исследования, которая при неудачном решении может полностью дискредитировать его результаты. Решается она в случае контент-анализа традиционными социологическими методами.

Рейдовый анализ, в противоположность фронтальному, ориентирован на решение частных и порой довольно экзотических задач, вытекающих, как правило, из каких-то скорее исследовательских, нежели прикладных интересов, и применительно к нему проблема выборки решается в связи формулировкой этих исследовательских целей и определением единиц анализа. Обоснование выборки при этом производится с учетом стандартных социологических критериев, но может допускать и их нарушение; важно лишь, чтобы факт этого нарушения осознавался и необходимость нарушения специальным образом обосновывалась.

2.3 Обработка, презентация и интерпретация результатов. Кодирование данных при контент-анализе обычно осуществляется с помощью достаточно простых анкет или компьютерных программ, в которых фиксируется каждое появление в анализируемом тексте искомой единицы. (Проблема подготовки кодировщиков, очень важная в практическом плане, в настоящей статье не затрагивается.) Эта элементарная схема может быть усложнена многими разными способами. Прежде всего, наборы единиц с сопоставленными им количественными оценками, как правило, сопоставляются с другими количественными оценками тех же единиц. Это могут быть, например, результаты подсчета частотности упоминания одних и тех же тем для различных выпусков одного и того же печатного издания или одной и той же регулярно выходящей в эфир новостной программы (временные ряды); результаты аналогичного подсчета для различных изданий/программ или, скажем, обобщенных категорий изданий. Очевидно, что такие данные могут быть представлены с помощью разнообразных графических средств – диаграмм, графиков и т.д., обеспечивающих наглядность. Наглядность, следует заметить, важна не только для аналитика: наглядная диаграмма или впечатляющий график обладают большим потенциалом воздействия, особенно в обществе, привыкшем с почтением относиться к естественнонаучному инструментарию. Классификации зачастую бывают многомерными, и для представления это также могут использоваться различные формальные средства. На практике результаты контент-анализа чаще всего представляются рядами диаграмм, столбчатых или круговых, хотя понятно, что в распоряжении контент-аналитика имеется все разнообразие средств представления количественных данных. А также и качественных: для отображения отношений между единицами контент-анализа и результатов их категоризации используются такие стандартные средства отображения структур, как различные графы. Квантификация данных, естественно, создает необходимые предпосылки для применения к ним средств математического анализа. Помимо анализа частотного распределения, к ним относится анализ различного рода корреляций между переменными, ассоциаций, анализ сопряженности, кластерный анализ. Разумеется, весь этот инструментарий должен применяться корректно. Если при определении единиц контент-анализа и идентификации их в тексте добиться полной объективности возможно лишь в некоторых (как правило, не самых интересных) случаях, то при экспликации и обработке данных обеспечить следование строгим стандартам вполне возможно. Содержательная интерпретация результатов зависит от целей анализа; она является прежде всего творческим актом, результаты которого во многом предопределены политологической квалификацией и интуицией аналитиков. В ходе контент-аналитического исследования как для анализа текста, так и для последующей обработки его результатов может использоваться вычислительная техника. Второй тип использования не вызывает особых проблем: после квантификации, т.е. перевода данных в числовую форму, их математическая и, в частности, статистическая обработка может осуществляться многими разными программными средствами, в том числе стандартными статистическими пакетами типа SPSS. При анализе текста и последующем сохранении результатов этого анализа в базах данных могут использоваться специальные программы, предназначенные для целей лингвистических исследований. В частности, анализ метафорики в русских политических текстах велся с помощью разработанной в Институте русского языка РАН программы Dialex, способной осуществлять составление частотных словарей и конкордансов, а также поиск лексических единиц с их контекстами и сохранять его результаты в базе данных; в настоящее время завершается работа над более совершенной системой, предназначенной для решения тех же задач. Некоторая подсистема контент-анализа входит составной частью в отечественную систему прикладного анализа текстов ВААЛ. Имеется также ряд зарубежных контент-аналитических компьютерных систем, а также систем, потенциально применимых для целей контент-анализа – такова, в частности, система KEDS, разработанная Ф.Шродтом в Канзасском университете и используемая для анализа потока политических событий, отображаемых на ленте информационного агентства «Рейтер».

В социологическом исследовании. – Во второй главе дается характеристика контент-анализу, возможности его использования и технике проведения. – В третьей главе изучаются основные преимущества и недостатки контент-анализа по сравнению с опросом. При написании курсовой работы были изучены учебные материалы, монографии, публикации на страницах периодической печати. 1. Природа метода опроса в...

... – это перевод в количественные, показатели массовой текстовой (или записанной на пленку) информации с последующей статистической ее обработкой. Его основные операции были разработаны американскими социологами X. Лассуэллом и Б. Берельсоном. Важный вклад в развитие процедур контент-анализа внесли российские и эстонские социологи, особенно А.Н. Алексеев, Ю. Вооглайд, П. Вихалемм, Б.Л. Грушин, Т.М. ...

В сферу педагогических исследований; 5. Контент-анализ не является универсальным средством получения информации и обладает как определенными достоинствами, так и ограничениями; 6. Контент-анализ вещания радиокорпорации «Авторадио» регистрирует ряд тенденций: а) наличие установок по шкале «Любовь-агрессия»; б) наличие установок по шкале «Толерантность – нонтолерантность» в сексуальной сфере, ...

Основа контент-анализа - это подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными иными количественными или качественными характеристиками. Отсюда понятно, что главная предпосылка контент-анализа - это выяснение того, что считать; иными словами, определение единиц анализа.

Единицы эти в зависимости от целей анализа, типа информационного массива, а также ряда дополнительных причин могут быть (и реально бывают) весьма разнообразными. К ним предъявляются два естественных, но, к сожалению, обычно плохо совместимых требования. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте; в идеале хотелось бы, чтобы их выявление вообще могло быть алгоритмизовано.

Понятно, что такому требованию лучше всего удовлетворяют формальные элементы текста или же элементы, имеющие четко выраженные и однозначные формальные соответствия, например слова. С другой стороны, от единиц контент-анализа чаще всего требуется некая субъективная, да к тому же еще и зависящая от контекста значимость, делающая их распределение и динамику такого распределения диагностичными для выявления изменений в индивидуальном и общественном сознании, системах убеждений и т.д. - иными словами, единицы должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации.

Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими разнообразными способами. Их идентификация в общем случае предполагает семантический анализ текста, проблема автоматизации которого, несмотря на многолетние усилия лингвистов и программистов, далека от решения. Характеристику единиц контент-анализа необходимо предварить кратким соображением о природе анализируемого информационного массива.

В самом определении метода контент-анализа нет ничего, что препятствовало бы применению его к отдельно взятому тексту; более того, примеры такого анализа известны. Тем не менее существует ряд причин, по которым объектом контент-аналитических проектов обычно является не отдельный текст, пусть даже значительный по объему, а именно информационный массив, или информационный поток, состоящий из большого количества текстов.

Во-первых, статистические закономерности проявляются тем более отчетливо, чем больше объем выборки.

Во-вторых, большинство целей контент-анализа предопределяют его тяготение к компаративности; аналитиков чаще всего интересуют не одномоментные срезы, а динамика изменений, а если и срезы, то, как правило, «пестрые», отражающие, например, различные СМИ или сознание различных социальных групп.

Наконец, при всем разбираемом ниже разнообразии единиц контент-анализа наиболее популярными являются различные макроединицы: темы и/или проблемы, пропозиции, образы и идеологемы. Таковых в отдельно взятых текстах и особенно в небольших по объему текстах СМИ обычно немного, да и новые макроединицы появляются не столь часто, поэтому оценить их динамику можно лишь на большом временном промежутке или при широком «горизонтальном сопоставлении».

Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных слоганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени. Конкретное разнообразие единиц контент-анализа практически безгранично, однако среди них можно выделить несколько основных типов. (Классификация, приводимая ниже, построена с учетом типологии К.Криппендорфа, однако отличается от нее весьма существенно.)

Единица контент-анализа

Единица контент-анализа

Единица контент-анализа - устойчиво повторяющаяся смысловая единица текста, относительно которой:
- выявляются статистические и структурные связи с другими единицами;
+ определяются иные количественные или качественные характеристиками.

Финансовый словарь Финам .


Смотреть что такое "Единица контент-анализа" в других словарях:

    - (един, один) многозначный термин. Нечто единое целое. Объект, обеспечивающий выполнение определённой функции, и который может быть заменён. Содержание 1 Математика 2 Измерение 3 Техни … Википедия

    Единица (един, один) многозначный термин. Содержание 1 Математика 2 Измерение 3 Экономика 4 Государство … Википедия

    - (от англ.: contents содержание, содержимое) или анализ содержания стандартная методика исследования в области общественных наук, предметом анализа которой является содержание текстовых массивов и продуктов коммуникативной корреспонденции. В… … Википедия

    КОНТЕНТ-АНАЛИЗ - (от англ. contens содержание) специальный достаточно строгий метод качественно количественного анализа содержания документов в целях выявления или измерения социальных фактов и тенденций, отраженных этими документами. Особенность К. А. состоит в… … Социология: Энциклопедия

    КОНТЕНТ-АНАЛИЗ - – один из основных видов анализа документов, заключающийся в количественном подсчете каких л. признаков, свойств изучаемого явления, отраженных в документе, с последующей оценкой на основе этого содержательных характеристик конфликтов. Для… … Энциклопедический словарь по психологии и педагогике

    Контент-анализ - от англ. content содержание) один из видов анализа документов; достаточно строгий научный метод, предполагающий систематическую и надежную фиксацию определенных элементов содержания некоторой совокупности документов с последующей квантификацией… … Социологический справочник

    ЕДИНИЦЫ ИЗМЕРЕНИЯ И ЕДИНИЦЫ АНАЛИЗА В КОНТЕНТ-АНАЛИЗЕ - элементы логич. модели предмета контент анлиза (см.). Содержание текста может быть измерено при помощи двух типов измерения (мер): единиц протяженности и единицы частоты. Единицы протяженности характеризуют содержание в целом, без учета его… …

    АНАЛИЗ ДОКУМЕНТОВ - совокупность методич. приемов, применяемых для извлечения из документальных источников социологич. информации, необходимой для решения исследовательских задач. Выделяются два основных метода анализа документов: неформализованный (традиционный) и… … Российская социологическая энциклопедия

    Анализ документов - один из основных методов сбора данных в социологическом исследовании, который направлен на получение надежной социальной информации (социальных фактов, ценностей и норм поведения различных категорий населения), зафиксированной в документах.… … Социологический справочник

    КОНКРЕТНОЕ СОЦИОЛОГИЧЕСКОЕ ИССЛЕДОВАНИЕ - целостная система теоретических и эмпирических процедур, способствующих получению нового знания об исследуемом объекте для решения конкретных теоретических и практических социальных проблем. К.С.И. проводятся обычно с целью решения конкретной… … Социология: Энциклопедия

элементы логич. модели предмета контент-анлиза (см.). Содержание текста может быть измерено при помощи двух типов измерения (мер): единиц протяженности и единицы частоты. Единицы протяженности характеризуют содержание в целом, без учета его деления на элементы. В качестве таких единиц чаще всего используются квадратный сантиметр (дюйм), стандартные строки верстки, минута (час) эфирного времени. Использование таких единиц позволяет достаточно точно определить объем внимания коммуникатора к различн. категориям анализа. В силу своей объектности указанные единицы пригодны для измерения только тех свойств коммуникатора, к-рые непосредственно выражаются в его тексте. Единица частоты позволяет измерять поведение и на уровне содержания текста (в частности, измерять структуру тематич. содержания текста). Если мера протяженности представлена достаточно большим видом единиц измерения, то мера частоты представлена единственной единицей измерения - единичным присутствием элемента содержания. Применительно к тексту приведенные единицы исчерпывают арсенал единиц измерения, поскольку текст и его содержание характеризуются только двумя свойствами, к-рые могут быть измерены: протяженностью и дискретностью структуры этой протяженности. Поэтому выделение большого числа типов единиц измерения (мер) является признаком нестрогости или эклектизма. Все единицы анализа в зависимости от характера их связи с единицами измерения можно разбить на два типа: частотные и частотно-протяженные. К частотным в качестве меры приложима только единица частоты (напр., к ним относятся слово, суждение); к частотно-протяженным - оба типа единиц измерения (напр., сообщение). В том случае, когда возможно использование обоих типов единиц измерения, встает проблема оптимальности выбора, сущность к-рой состоит в том, чтобы ответить на вопрос: "Выражается ли данный признак наиболее адекватно при помощи протяженности или при помощи частоты?". Ответ на такой вопрос не является тривиальным и требует проведения специальных исследований. В принципе можно предположить, что число типов единиц анализа велико. Можно считать, что каждая из единиц содержания текста может быть потенциально единицей анализа. Введение новых единиц анализа определяется соответствующими теоретич. предпосылками. Поскольку запас языковых единиц содержания (как типов) ограничен, то и число единиц анализа, рекрутируемых из этой сферы, невелико. Значительный по объему источник потенциальных единиц анализа представляют тематич. элементы содержания текста. Единицы анализа могут быть классифицированы по следующим трем основаниям: языковые-тематич., объектные-необъектные, коммуникационные-структурные. Как правило, языковые единицы (элементы структуры языка) крайне редко используются в качестве единиц анализа в социологич. исследованиях. Тематич. единицы (элементы структуры содержания текста) в настоящее время занимают все большее место в контент-аналитич. исследованиях (напр., тема сообщения, герой, ситуация). Те единицы анализа, к-рые непосредственно представлены в тексте, являются объектными. К ним относятся единицы протяженности (сообщение, рубрика, слово, предложение). К необъектным единицам относятся все тематич. единицы. Противопоставление коммуникационных единиц структурным связано с онтологическим статусом единиц анализа. Естественно, что все языковые единицы обладают этим статусом (т. е. используются и при создании текста, и при его потреблении). Таким статусом обладают и нек-рые тематич. единицы (напр., тема сообщения). Наиболее часто используются следующие единицы анализа. Слово (словосочетание) - наименьшая единица анализа (из языковых), приемлемая в социологич. исследовании; используется в анализе политич. языка, исследовании стиля сообщений. Сообщение - одна из наиболее часто используемых единиц анализа. Характеризуется целостностью. Размер и структура сообщений зависят от типа коммуникации. Выделение сообщения в структуре текста обычно не требует к.-л. специальных инструкций. Герой (характер) - определенный тип деятеля, обладающего четко выраженными соц. чертами. Наиболее часто эта единица используется при анализе небольших произведений литературы (рассказ, очерк). Примером этой единицы является герой информации, выделяемый в содержании на основе рода его занятий. Тема - очень широко применяемая и очень плохо разработанная единица анализа. В амер. литературе термины "суждение" и "тема" употребляются как синонимы, причем чаще всего тема определяется через понятие суждения. Понятие темы используется в таких случаях в категориальном значении, т. е. говорится скорее о тематич. признаке, чем о единице анализа, ибо темы могут выделяться и в целых сообщениях, и в их частях различн. объема (абзацах, предложениях). Тема может быть выражена не только суждением, но и словом, и словосочетанием (напр., наименование рубрики в газете). Суждение - наиболее мощная и сложная в использовании единица анализа. В качестве его определения может быть принято определение суждения в логике с учетом двух особенностей использования этой единицы в контент-анализе. Во-первых, суждение обладает высокой степенью конструктивности и поэтому, вероятно, не является коммуникационной единицей. Во-вторых, структура суждения как единицы анализа обычно является более расчлененной и сложной, чем в логике. Чаще всего она состоит более чем из трех элементов (субъекта, предиката и связки). В общем виде структура суждения может быть представлена в фасетной форме, т. е. в виде ряда ячеек, в к-рых расположены однотипные элементы. Такое представление означает, что при конкретном наполнении такая структура порождает огромное число типов суждений (напр., при шести фасетах и числе элементов в каждом из них от 5 до 10 общее число типов суждений может достигать нескольких миллионов). Практически в исследуемых текстах на один тип суждения в среднем приходится 1-2 упоминания, следовательно, значительное число типов суждений вообще не встречается в содержании текста. Поэтому чаще всего информация анализируется не в виде суждений в целом, а в виде отдельных фасетов, т. е. единицей анализа практически является элемент суждений. При использовании ЭВМ можно выделить эмпирически наиболее значимые в статистич. отношении типы суждений и вести их анализ. Возможно также и такое решение: определить уровень отождествления суждений (напр., на основе их модальности), и различать суждения согласно этому уровню; при этом число типов суждений уменьшается до приемлемой величины (5-10 типов). Суждение является гибкой единицей анализа, может быть использовано для относительно небольших частей содержания текста. Ситуация - это единица, к-рая имеет целью представить содержание текста в виде структуры, отражающей фрагменты действительности. Фрагменты могут быть представлены не только в виде действующего лица, но и в виде мотивов, средств, целей деятельности. В состав структуры ситуации могут входить следующие элементы: субъект деятельности, локальность субъекта (сфера соц. жизни и т. п.), характер представления субъекта коммуникатором, знак отношения коммуникатора к субъекту, интересы субъекта, его цели, мотивы действий и т. п. Близкой по замыслу к ситуации является такая единица анализа, как единица действия, к-рая может быть использована как элемент ситуации. Классич. примером такой единицы является функция действующих лиц волшебных сказок, разработанная В.Я.Проппом. В большинстве контент-аналитич. исследований используется несколько единиц анализа. Это связано с кодировочной операцией в контент-анализе, где необходимо взаимодействие единиц анализа. Указанное взаимодействие может быть рассмотрено в связи с двумя процессами, во многом обеспечивающими получение аналитич. информации (т. е. информации о предмете исследования, получаемой в соответствии с задачами исследования): процессом кодирования и процессом структурирования закодированного материала. В процессе кодирования выделяются два аспекта: разбиение содержания текста на единицы (юнитизация) и их классифицирование по категориям анализа. В рамках разбиения содержания текста выделяются единицы: выборочн., наблюдения, фиксирующая, кодировочная контекста. Эти пять типов единиц представляют наиболее общий случай. В отдельных исследованиях число единиц может быть меньшим. Границы между типами единиц являются достаточно подвижными, т. е. возможен переход конкретных единиц из типа в тип. Выборочн. единица определяет объем исследуемого текста. Чаще для этого используется макросообщение (номер газеты, день вещания или программа вещания). Однако можно представить себе иерархич. структуру выборки, в к-рой в роли единиц последовательно выступают, напр., номер газеты, материал, суждение. Единицей наблюдения, т. е. единицей, в рамках к-рой производится семантич. анализ содержания текста с целью кодирования, обычно является сообщение (напр., статья, очерк и т. а). При иерархич. структуре выборки в роли единицы наблюдения могут выступать и части сообщения. Фиксирующая единица - это та часть содержания текста, в пределах к-рой происходит фиксация категорий анализа. Смысл введения этой единицы определяется спецификой частотного измерения (основанного на использовании единицы частоты). В границах фиксирующей единицы появление категории фиксируется только один раз. Выбор этой единицы сказывается на рез-тах анализа. Поэтому важно определение относительной протяженности единицы фиксирований. Пока часто используется механич. разбиение текста на фиксирующие единицы (напр., 50, 100, 150 строк). Однако следует признать, что механич. разбиение не является обоснованным и очень плохо связано с тематич. структурой содержания. По-видимому, объем указанной единицы должен определяться характером коммуникационного процесса. Кодировочная единица обеспечивает фиксирование категорий анализа и тем самым измерение интенсивности появления признаков объекта исследования. В качестве кодировочных обычно выступают такие единицы, как слово, тема, сообщение, суждение, ситуация, действие. Кодировоч. единица зависит от единицы контекста - части содержания текста, знание к-рой позволяет произвести классифицирование единицы содержания, релевантной принятой кодировочной единице, и соответствующую категорию анализа. Естественной единицей контекста выступает сообщение. (В этом случае может совпадать с единицей наблюдения; однако факт совпадения на означает, что не нужно функциональное разграничение этих типов жизнь ниц. ведь эти единицы выполняют различ. функции) Возможно использование меньших и больших, чем сообщение, единиц контекста (напр., абзаца, страницы). При использовании для измерения единиц протяженности фиксирующая единица сливается с кодировочной. В этом случае процесс кодирования осложняется необходимостью измерения протяженности единиц содержания, релевантных кодировочной единице. Основание классификации связано с выделением единицы анализа, при помощи к-рой производится структурирование закодированного материала, т. е. представление структуры ана-литич. информации. Здесь выделяются единицы классификации и единицы структурирования. В роли первых выступают единицы, используемые в качестве кодировочных. Единицы структурирования - это единицы, в терминах к-рых ведется анализ. Выбор единицы структурирования обосновывается целями исследования и часто существенно влияет на выводы аналитика. Существует еще одна возможность взаимодействия единиц, к-рая связана со стадиями анализа. Поскольку большая по объему единица анализа может быть охарактеризована при помощи меньших, то при использовании в качестве кодировочных наименьших (из приемлемых для проводимого исследования) единиц мы сохраняем возможность использовать закодированный материал для целей интегрирования на уровне единиц анализа. Так, возможен переход от слов и суждений к сообщениям. Конечно, возможность такого перехода определяется категориальной системой предмета исследования (т. к. иногда единицы анализа определенного объема могут быть нерелевантными принятым в исследовании категориям анализа). Наиболее оптимальным является вариант одновременного интегрирования категорий и единиц анализа. Он дает возможность измерения в одном исследовании различн. уровней содержания текста. Лит.: см. к ст. Контент-анализ. Е.Л. Гаршис.

Основа процедуры контент-анализа - это подсчет встречаемости некоторых компонентов в анализируемом тексте, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними.

Таким образом, главная предпосылка контент-анализа - это выяснение того, что считать и как считать; иными словами, определение единиц анализа. Выделяют две единицы анализы: смысловые и единицы счета. При этом главной смысловой единицей должна быть социальная идея, социально-значимая тема, отображенная в операциональных понятиях. Цель исследования – отыскать индикаторы, указывающие на наличие в документе темы, значимой для анализа, и раскрывающие содержание текстовой информации.

Единицы эти в зависимости от целей анализа, типа информационного массива могут быть весьма разнообразными. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте. С другой стороны, единицы должны быть интересными для последующей интерпретации. Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими способами. Их идентификация в общем случае предполагает семантический анализ текста. Чаще всего подсчитывают «интересные» или «ключевые» слова или словосочетания, однако чаще исследователя интересуют не отдельные слова, а тематическое целое, стоящие за отдельными словами категории.

Единицы анализа должны легко и по возможности однозначно идентифицироваться в тексте. В идеале их лучше всего свести к самым употребляемым значкам, например, запятым или точкам. Тогда их подсчет не будет представлять никаких трудностей.

При всем разнообразии единиц контент-анализа наиболее популярными являются макроединицы: темы или проблемы, пропозиции, образы и идеологемы. Таковых в отдельно взятых текстах и особенно в небольших по объему текстах СМИ обычно немного, поэтому оценить их динамику можно лишь на большом временном промежутке или при широком «горизонтальном сопоставлении».

Среди единиц контент-анализа можно выделить несколько основных типов:

1. «Физические» единицы. Под ними понимаются сущности с четко очерченными физическими, геометрическими или временными границами, как, например, экземпляры книги, номера газет, экземпляры плакатов или листовок, фотографии и т.п. Подсчет их не составляют особого труда, однако необходимость в таком подсчете возникает достаточно редко и чаще всего осуществляется с целью оценки представленности какой-то тематики или оценки.

2. Структурно-семиотические единицы. Это:

Лексика языка (слова и их эквиваленты, например выражение железная дорога или термин контент-анализ, т. е. то, что фиксируется в словарях);



Грамматические показатели (например, отрицательные частицы).

Количественный подсчет встречаемости слов в тексте - это, пожалуй, самый простой вариант контент-анализа, который, однако, зачастую способен давать небезынтересные результаты. Чаще всего, конечно, подсчитываются «интересные», или «ключевые» слова или словосочетания, например названия ценностных категорий типа свобода, стабильность, доверие, территориальная целостность; сценариев типа предательство или разочарование; достаточно однозначные обозначения тех или иных общественно значимых явлений, например коррупция, преступность или терроризм; значимые атрибуты наподобие жесткий, решительный; эмоционально окрашенная оценочная лексика типа разрушительный, неудержимый, подлый, кошмарный, человеконенавистнический; слова-пароли (тоже зачастую эмоционально окрашенные) типа патриоты, коммунофашисты, мондиалисты; слова, сильно активизированные в конкретный момент времени, вроде «Семья» или «Мабетекс» в начале осени 1999 года.

Контент-анализ грамматических категорий используется достаточно редко, стимулом к которому является гипотеза о том, что употребление грамматических форм в меньшей степени, чем употребление лексики, контролируется автором текста и поэтому может послужить источником таких сведений о нем, которые он сам вовсе не собирался делать доступными своим читателям. В политической психологии существует специальная исследовательская методика, так называемый анализ когнитивной сложности, которая на основе фактически контент-аналитической процедуры позволяет делать выводы о том, насколько простым или сложным является видение политической ситуации автором текста и как оно меняется со временем. Единицами контент-анализа, лежащего в основе оценки когнитивной сложности, являются, например, относимые обычно к служебной лексике категорические квантификаторы типа «всегда», «никогда», «всякий», которым противостоят квантификаторы типа «иногда», «некоторый» и т.п.; категорические оценки истинности в противоположность осторожным «возможно» или «не исключено, что»; языковые средства дифференцированного рассмотрения ситуации наподобие «с одной стороны...», «с другой стороны» и т. д.



Поскольку объектами контент-анализа могут быть не только вербальные (естественноязыковые), но и другие виды текстов (например, карикатуры, фотоснимки, рекламные клипы), постольку в числе структурно-семиотических единиц контент-анализа могут присутствовать визуальные и звуковые (чаще всего музыкальные) образы и символы, которые могут анализироваться на тех же основаниях, что и единицы естественного языка.

3. Понятийно-тематические единицы. В большинстве случаев контент-аналитик интересуется не словами как таковыми и не грамматическими категориями, а стоящими за словами значимыми для него понятиями, темами, проблемами. Исследователь, интересующийся тем, какое место в общественном сознании занимает, скажем, проблема преступности, обязан принимать во внимание не только присутствие в информационном массиве слова «преступность», но и упоминания заказных и всяких прочих убийств, бандитского беспредела, «крыши», «братков», авторитетов, власти криминала и т. д. Интересующийся отношением общественного сознания к каким-то реалиям должен принимать во внимание самый широкий спектр позитивных, негативных и некоторых более конкретных оценок, которые могут быть даны этим реалиям, причем эти оценки вовсе не обязательно должны присутствовать в виде оценочных суждений.

4. Референциальные и квазиреференциальные единицы. К референциальным, точнее, конкретно-референциальным единицам относятся обозначения реальных личностей (как современных, так и исторических деятелей), событий, городов, стран, организаций и т. д. Этот блок, особенно в части персоналий, весьма важен и диагностичен, поскольку позволяет определять личностные рейтинги, оценивать идеологические системы с точки зрения присутствующих в них референтных «знаковых» фигур, своего рода «идеологических героев». Примером интересного исследования роли референтных фигур в российском оппозиционном дискурсе 1996-1997 может послужить работа А.В. Дуки, в которой показано, что способы обозначения в тексте конкретных фигур могут различаться (В.В.Жириновский, Владимир Вольфович, Вольфыч, Жирик, сын юриста, лидер ЛДПР, самый провосточный российский политик, главный либеральный демократ, либералиссимус), однако конкретно-референтная единица здесь во всех случаях одна.

Квазиреференциальные единицы в политических текстах чаще всего бывают представлены обозначениями всякого рода «сил» - коллективных актеров политической сцены, референция которых может колебаться от реальной (типа КПРФ) через обобщенную (коммунисты, либералы, Запад, исламисты) к откровенно мифологизированной (мировая закулиса). Независимо от своей референции все эти персонажи присутствуют в идеологическом пространстве, им могут приписываться действия и оценки, и отношение к ним является немаловажным политико-идеологическим фактором. Грань между квазиреференциальными и некоторыми типами понятийно-тематических единиц размыта в силу того, что некоторые политические понятия способны и даже склонны (например, та же преступность) к метафорической персонификации.

5. Пропозициональные единицы и оценки. Это примеры высказываний, в основе которых лежат пропозиции - описания конкретных ситуаций. Наряду с пропозициями для контент-анализа могут представлять большой интерес оценки. Изучение динамики оценочных суждений, высказываемых в адрес тех или иных лиц, событий, институтов, - весьма распространенный тип контент-аналитического исследования.

6. Макроструктурные единицы. Это достаточно сложные понятийные конструкции, образующие «верхние этажи» человеческих представлений о мире и, в частности, идеологических систем. Эти конструкции, как правило, носят характер сценариев и описывают стереотипные модели развития, с которыми сопряжены ожидания будущего, соображения о прошлом, эмоциональные ассоциации и т.д. Часто эти конструкции имеют литературные или фольклорные прототипы, что отражается в их названиях. Для обозначения таких конструкций чаще всего используется термин «идеологема»; в различных дисциплинах говорят также о мифологемах, кочующих образах и т.д. Среди подобного рода конструкций, присутствующих в общественном сознании современной России, имеются, например, следующие: «Заговор», «Криминальная революция», «Беспредел», «Нет, ребята, все не так», «Возвращение в цивилизацию» и др.

7. Единицы, представляющие результаты концептуальных операций. Их довольно много, однако наибольший интерес для контент-анализа представляют метафоры, примеры и аналогии, которые в общем плане уже были охарактеризованы выше. Например, в политических текстах часто встречается упоминавшаяся «военная метафора» в варианте «Политическое противостояние – это война», проявляющаяся в таких выражениях, как война с бедностью, удар по губернатору, атака со стороны оппозиции, разгромная публикация и т. д.

8. «Поэтические» единицы. Под таковыми имеются в виду допускающие количественное измерение средства художественной выразительности - каламбуров, аллитераций и т. п.

1. Единицы, категории и признаки. Несмотря на то, что контент-анализ является в своей основе количественным методом, в нем почти всегда присутствует и качественная составляющая. Иными словами, контент-аналитик занимается количественным анализом качественных категорий. Но этим дело не исчерпывается. Во многих контент-аналитических проектах осуществляется не только оценка степени представленности в тексте тех или иных единиц, но и одновременная оценка этих единиц по тем или иным градуированным качественным шкалам. В частности, это могут быть предложенные Ч. Осгудом шкалы абстрактности (фактически - трудности для восприятия) того или иного содержания; расстояния до индивидуума (какие-то содержательные компоненты могут непосредственно касаться читателей, а какие-то могут представлять лишь досужий интерес). При анализе могут быть использованы и другие шкалы, кроме того, единицы контент-анализа могут объединяться в различные более широкие категории.

2. «Фронтальный» и «рейдовый» контент-анализ. Контент-аналитические исследования можно разделить на два больших класса, которые, пользуясь вышеупомянутой «военной метафорой», можно назвать фронтальными и рейдовыми. Задачей фронтального контент-аналитического исследования является составление максимально более полного представления об информационном потоке - либо на моментальном срезе, либо на протяжении некоторого периода с целью оценки динамики. Это попытка получить ответ на вопрос «Что пишут?» Единицы такого анализа в принципе могут быть любыми, но чаще всего в таковом качестве выступают либо тематические единицы, либо ключевые слова, реже оценки и пропозиции и еще реже макроструктурные единицы. Такой анализ обычно носит сугубо прикладной характер и ведется в режиме мониторинга. Поскольку целью его является составление общего представления о содержании СМИ и через него - об общественном сознании, он должен в идеале стремиться к возможно более широкому охвату информационного потока. На практике, однако, полный охват чаще всего бывает невозможен, да зачастую и не нужен. Тем самым на повестку дня контент-аналитического исследования встает проблема составления репрезентативной выборки - традиционная проблема эмпирического социологического исследования, которая при неудачном решении может полностью дискредитировать его результаты. Решается она в случае контент-анализа традиционными социологическими методами.

Рейдовый анализ, в противоположность фронтальному, ориентирован на решение частных и порой довольно экзотических задач, вытекающих, как правило, из каких-то скорее исследовательских, нежели прикладных интересов, и применительно к нему проблема выборки решается в связи формулировкой этих исследовательских целей и определением единиц анализа. Обоснование выборки при этом производится с учетом стандартных социологических критериев, но может допускать и их нарушение; важно лишь, чтобы факт этого нарушения осознавался и необходимость нарушения специальным образом обосновывалась.

3. Обработка, презентация и интерпретация результатов.

Кодирование данных при контент-анализе обычно осуществляется с помощью достаточно простых анкет или компьютерных программ, в которых фиксируется каждое появление в анализируемом тексте искомой единицы. (Проблема подготовки кодировщиков, очень важная в практическом плане, в настоящей статье не затрагивается.) Эта элементарная схема может быть усложнена многими разными способами. Прежде всего, наборы единиц с сопоставленными им количественными оценками, как правило, сопоставляются с другими количественными оценками тех же единиц. Это могут быть, например, результаты подсчета частотности упоминания одних и тех же тем для различных выпусков одного и того же печатного издания или одной и той же регулярно выходящей в эфир новостной программы (временные ряды); результаты аналогичного подсчета для различных изданий/программ или обобщенных категорий изданий. Очевидно, что такие данные могут быть представлены с помощью разнообразных графических средств - диаграмм, графиков и т.д., обеспечивающих наглядность. Классификации зачастую бывают многомерными, и для представления это также могут использоваться различные формальные средства. На практике результаты контент-анализа чаще всего представляются рядами диаграмм, столбчатых или круговых, хотя понятно, что в распоряжении контент-аналитика имеется все разнообразие средств представления количественных данных. А также и качественных: для отображения отношений между единицами контент-анализа и результатов их категоризации используются такие стандартные средства отображения структур, как различные графы.

Квантификация данных создает необходимые предпосылки для применения к ним средств математического анализа. Помимо анализа частотного распределения, к ним относится анализ различного рода корреляций между переменными, ассоциаций, анализ сопряженности, кластерный анализ. Разумеется, весь этот инструментарий должен применяться корректно. Содержательная интерпретация результатов зависит от целей анализа; она является прежде всего творческим актом, результаты которого во многом предопределены квалификацией и интуицией исследователей.

В ходе контент-аналитического исследования как для анализа текста, так и для последующей обработки его результатов может использоваться вычислительная техника. После квантификации, т. е. перевода данных в числовую форму, их математическая и, в частности, статистическая обработка может осуществляться многими программными средствами, в том числе стандартными статистическими пакетами типа SPSS. При анализе текста и последующем сохранении результатов этого анализа в базах данных могут использоваться специальные программы, предназначенные для целей лингвистических исследований (программа Dialex, способная осуществлять составление частотных словарей и конкордансов, а также поиск лексических единиц с их контекстами и сохранять его результаты в базе данных. Подсистема контент-анализа входит составной частью в отечественную систему прикладного анализа текстов ВААЛ. Имеется также ряд зарубежных контент-аналитических компьютерных систем, а также систем, потенциально применимых для целей контент-анализа - в частности, система KEDS).

Процедура контент-анализа следующая:

1. Определение проблемы, цели, задачи, объекта и предмета исследования. Разрабатывается программа контент-аналитического исследования, формируется репрезентативная выборка, отбираются необходимые доку­менты. При определении надежности документа необходимо четко опре­делить, что это за документ, с какой целью он создавался, кто его автор.

2. Выделение в текстовой информации категории анализа - смысловой
единицы анализа,
которая получается путем интерпретации понятий.

Категории анализа должны выражать теоретические понятия исследования, иметь смысловые единицы в тексте, обладать возможностями однозначной регистрации признаков. Категории анализа выражаются определенными признаками со своей интенсивностью, направленностью, значимостью проблемы или идей.

В качестве смысловых единиц анализа могут выступать:

· понятия, выраженные в словах и отдельных терминах;

· тема, выраженная в смысловых абзацах, частях текста, статьях;

· имена исторических личностей, политиков, организаторов производства, наименования учреждений и т.д.;

· общественные события, факты, случаи и т.д.

3. Выделение единиц анализа, которые являются результатом операционализации понятий.

Единицы анализа выделяются на основе содержания гипотез исследования. Единицы анализа могу не совпадать с единицами счета.

4. Единица счета - это количественная характеристика единицы ана­лиза, фиксирующая регулярность, с которой встречается в тексте та или иная смысловая единица (число слов, строк, абзацев, знаков, колонок, длитель­ность звучания, метраж пленки и т.д.).

5. Процедурный подсчет употребления единиц анализа и подсчет частоты встречаемости этих единиц в выборке.

Обязательный момент в такой процедуре – использование математико-статистических методов счета. Связь между категориями устанавливается методом совместной встречаемости слов различных категорий: для каждого текста выясняется, слова каких категорий в нем встречаются. После этого подсчитывается коэффициент корреляции, выражающий силу связи между категориями и знак этой связи.

Обоснованность (валидность) разработанной методики можно проверить:

· при помощи экспертов,

· получением аналогичных данных другими методами,

· повторным кодированием тех же документов по единой инструкции.

Сбор информации, регистрация единиц анализа осуществляется с помощью обязательного инструментария - заранее разработанных макетов таблиц, специальных карточек или при помо­щи специальных кодировальных матриц. Бланк кодировки составляется в соответствии со схемой операциональных понятий, содержит единицы анализа и все элементы описания проблемной ситуации.


Нажимая кнопку, вы соглашаетесь с политикой конфиденциальности и правилами сайта, изложенными в пользовательском соглашении