чем определяются количественные характеристики информации
ЦП Автоматизированные системы управления и промышленная безопасность
БК Автоматизированные системы управления и кибернетика
2. Меры и единицы представления, измерения и хранения информации
Количественные характеристики информации
Классификация мер информации представлена на рис.1.
Рис. 1. Классификация мер информации
Синтаксическая мера информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту. На синтаксическом уровне учитываются тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов представления информации.
Существуют два основных подхода в определении количества информации. Исторически они возникли почти одновременно. В конце 40-х г. XX века один из основоположников кибернетики, американский математик Клод Шеннон развил вероятностный подход к измерению количества информации, а работы по созданию ЭВМ привели к «объемному» подходу.
Объём данных (VД) понимается в техническом смысле этого слова как информационный объём сообщения или как объём памяти, необходимый для хранения сообщения без каких-либо изменений.
Информационный объём сообщения измеряется в битах и равен количеству двоичных цифр (“0” и “1”), которыми закодировано сообщение.
В компьютерной практике слово “бит” используется также как единица измерения объёма памяти. Ячейка памяти размером в 1 бит может находиться в двух состояниях (“включено” и “выключено”) и в неё может быть записана одна двоичная цифра (0 или 1). Понятно, что бит – слишком маленькая единица измерения информации, поэтому пользуются кратными ей величинами. Основной единицей измерения информации является байт. 1 байт равен 8 битам. В ячейку размером в 1 байт можно поместить 8 двоичных цифр, то есть в одном байте можно хранить 256 = 2 8 различных чисел. Для измерения ещё больших объёмов информации используются следующие величины:
1 Кбайт (один килобайт) = 2 10 байт = 1024 байта (1 kB );
1 Мбайт (один мегабайт) = 2 10 Кбайт = 1024 Кбайта (1 MB );
1 Гбайт (один гигабайт) = 2 10 Мбайт = 1024 Мбайта (1 GB );
1 Тбайт (один терабайт) = 2 10 Гбайт = 1024 Гбайта (1 TB );
1 Пбайт (один петабайт) = 2 10 Тбайт = 1024 Тбайта (1 PB );
1 Эбайт (один эксабайт) = 2 10 Пбайт = 1024 Пбайта (1 EB );
1 Збайт (один зеттабайт) = 2 10 Эбайт = 1024 Эбайта (1 ZB );
1 Йбайт (один йоттабайт) = 2 10 Збайт = 1024 Збайта (1 YB ).
При вероятностном подходе количество информации I на синтаксическом уровне определяется через понятие энтропии системы.
Пусть до получения информации потребитель имеет некоторые предварительные (априорные) сведения о системе α. Мерой его неосведомленности о системе является функция H(α), которая в то же время служит и мерой неопределенности состояния системы.
После получения некоторого сообщения β получатель приобрел некоторую дополнительную информацию Iβ(α), уменьшившую его априорную неосведомленность так, что неопределенность состояния системы после получения сообщения β стала Hβ(α).
Тогда количество информации Iβ(α) о системе, полученной в сообщении β, определится как
т.е. количество информации измеряется изменением (уменьшением) неопределенности состояния системы. Если конечная неопределенность Hβ(α) обратится в нуль, то первоначальное неполное знание заменится полным знанием и количество информации будет определяться как Iβ(α) = H(α). Иными словами, энтропия системы Н(а) может рассматриваться как мера недостающей информации.
Энтропия системы H(α), имеющая N возможных состояний, согласно формуле Шеннона, равна:
Пример 2. Часто информация кодируется числовыми кодами в той или иной системе счисления, особенно это актуально при представлении информации в компьютере. Естественно, что одно и то же количество разрядов в разных системах счисления может передавать разное число состояний отображаемого объекта, что можно представить в виде соотношения
m – основание системы счисления (разнообразие символов, применяемых в алфавите);
n – число разрядов (символов) в сообщении.
Если в качестве основания логарифма принять m, то I = n. В данном случае количество информации (при условии полного априорного незнания абонентом содержания сообщения) будет равно объему данных I = VД, полученных по каналу связи.
Наиболее часто используются двоичные и десятичные логарифмы. Единицами измерения в этих случаях будут соответственно бит и дит.
Семантическая мера информации
Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Для этого используется понятие «тезаурус пользователя».
Тезаурус – это совокупность сведений, которыми располагает пользователь или система.
В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sp изменяется количество семантической информации Ic,воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер зависимости количества семантической информации, воспринимаемой потребителем, от его тезауруса показан на рис. 2.
Рис. 2. Характер зависимости количества семантической информации от его тезауруса
Рассмотрим два предельных случая, когда количество семантической информации Icравно 0:
• при пользователь не воспринимает и не понимает поступающую информацию;
• при пользователь все знает, и поступающая информация ему не нужна.
Максимальное количество семантической информации Ic потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом Sp (Sp = Sp opt), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения. Следовательно, количество семантической информации в сообщении, т.е. количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным для пользователя некомпетентного.
Прагматическая мера информации (аксиологический подход)
Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цепи. Эта мера также является величиной относительной, обусловленной особенностями использования этой информации в той или иной системе.
Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.
Представим для сопоставления введённые меры информации в таб. 1.
Таб. 1. Меры информации
Чем определяются количественные характеристики информации
Строго научного определения, что такое информация не существует. Разные люди при разных обстоятельствах могут вкладывать в это понятие разный смысл. В бытовом смысле информация – это сведения, которые человек получает от окружающего мира с помощью органов чувств. Для математика понятие информации шире. Информация – это те сведения, которые человек создал сам с помощью умозаключений. (Теоремы, Постулаты, Аксиомы). Для биолога к информации относятся и те данные, которые человек хранит в себе с момента рождения и до самой смерти. Это генетический код, благодаря которому дети так похожи на своих родителей.
Итак, в разных научных дисциплинах и в разных областях техники существуют разные понятия об информации. Но все отрасли сходятся в том, что информацию необходимо создавать, передавать, принимать, хранить и обрабатывать. Вот это и есть задачи информатики.
Информатика – это техническая наука, изучающая способы создания, хранения, обработки и передачи (и защиты) информации средствами вычислительной техники.
Возникнув как наука об информации, информатика в настоящее время развивается по многим другим направлениям. Предмет информатики точно невозможно определить – он сложный, многосторонний, динамичный.
Предметная область информатики
Теоретическая информатика (Brainware)
Этот раздел информатики использует математические методы для общего изучения процессов обработки информации.
Теория алгоритмов
Прикладная информатика
(Software)
изучением закономерностей в информационных процессах (накопление, переработка, распространение);
созданием информационных моделей коммуникаций в различных областях человеческой деятельности;
разработкой информационных систем и технологий в конкретных областях и выработкой рекомендаций относительно их жизненного цикла: для этапов проектирования и разработки систем, их производства, функционирования и т.д.
Технические средства (Hardware)
раздел, в котором разрабатываются общие принципы построения вычислительных систем. Речь идет не о технических деталях и электронных схемах (это лежит за пределами информатики как таковой), а о принципиальных решениях на уровне, так называемой, архитектуры вычислительных (компьютерных) систем, определяющей состав, назначение, функциональные возможности и принципы взаимодействия устройств.
2. Свойства информации
2.1. Качественные характеристики информации
Основные свойства информации:
Адекватность – это степень соответствия создаваемого с помощью полученной информации образа реальному объекту, процессу, явлению и т.п.
Доступность – это мера возможности получить ту или иную информацию.
Понятность
Достоверность
Массовость
Устойчивость
Ценность
2.2. Количественные характеристики информации
Меры информации | ||
Наименьшая единица информации называется – бит. |
Разумеется, с помощью одного бита невозможно представить цифры десятичной системы исчисления или буквы алфавита, поэтому для представления символов используется несколько бит.
8 бит это 1 байт.
В настоящее время проблема множества несовместимых кодировок практически решена путем использования двухбайтовой кодировки. При такой кодировке можно закодировать 65 535 символов. Постепенно происходит переход к стандартной двухбайтовой кодировке UTF-8 (Unicode), в которую изначально включены все символы не только латиницы и кириллицы, но и множества других алфавитов (в настоящее время занято 29000 возможных комбинаций).
Как перевести десятичное число в двоичное?
Делением на два, остаток, записанный с конца, и есть двоичное число.
Как перевести двоичное число в десятичное?
Надо сложить двойки в степенях, соответствующих позициям, где в двоичном стоят единицы.
Например: Возьмем число 20. В двоичной системе оно имеет следующий вид: 10100. Итак (начнем слева направо, считая от 4 до 0; число в нулевой степени всегда равно единице (вспоминаем школьную программу по математике)):
10100 = 1*2 4 + 0*2 3 + 1*2 2 + 0*2 1 + 0*2 0 = 20
Так как в двоичной системе счисления основанием является число 2, то все единицы информации кратны двум в степени n (2n):
1 б = 8 бит = 23 бит
1 Кб = 210 б = 1024 б
1 Мб = 220 б = 1024 Кб
1 Гб = 230 б = 1024 Мб
1 Тб = 240 б = 1024 Гб
Реклама: «При покупке у нас 1 Mб памяти 24 Кб вы получаете бесплатно»
3.4. Кодирование текста
Текст закодировать довольно просто. Для этого достаточно как-нибудь перенумеровать все буквы, цифры, знаки препинания и другие используемые при письме символы. Для хранения одного символа чаще всего используется восьмиразрядная ячейка — один байт, иногда два байта (иероглифы, например). В байт можно записать 256 различных чисел, значит, это позволит закодировать 256 различных символов. Соответствие символов и их кодов задаётся в специальной таблице. Коды записываются в шестнадцатеричной системе, так как для записи числа из восьми разрядов нужно всего две шестнадцатеричных цифры.
3.5. Кодирование звука
3.6. Кодирование изображения
Цветные изображения воспринимаются нами как сумма трёх основных цветов — красного, зелёного и синего.
Например: сиреневый = красный + синий; жёлтый = красный + зелёный; оранжевый = красный + зелёный, но в другой пропорции.
Поэтому достаточно закодировать цвет тремя числами — яркостью его красной, зелёной и синей составляющих. Этот способ кодирования называется RGB (Red—Green—Blue). Его используют в устройствах, способных излучать свет (мониторы).
При рисовании на бумаге действуют другие правила, так как краски сами по себе не испускают свет, а только поглощают некоторые цвета спектра. Если смешать красную и зелёную краски, то получится коричневый, а не жёлтый цвет. Поэтому при печати цветных изображений используют метод CMY (Cyan—Magenta—Yellow) — голубой, сиреневый, жёлтый цвета. При таком кодировании красный = сиреневый + жёлтый; зелёный = голубой + жёлтый.
1. Понятие «информация». Количественные и качественные характеристики информации. Свойства информации. Виды информационных процессов. Понятие «данные». Типы данных.
Информация – это знания или сведения о ком-либо или о чем-либо. Информация – это сведения, которые можно собирать, хранить, передавать, обрабатывать, использовать. Термин информация происходит от латинского слова informatio, что означает сведения, разъяснения, изложение. В настоящее время наука пытается найти общие свойства и закономерности, присущие многогранному понятию информация, но пока это понятие во многом остается интуитивным и получает различные смысловые наполнения в различных отраслях человеческой деятельности: 1. в быту информацией называют любые данные, сведения, знания, которые кого-либо интересуют. Например, сообщение о каких-либо событиях, о чьей-либо деятельности и т.п.; 2. в технике под информацией понимают сообщения, передаваемые в форме знаков или сигналов (в этом случае есть источник сообщений, получатель (приемник) сообщений, канал связи); 3. в кибернетике под информацией понимают ту часть знаний, которая используется для ориентирования, активного действия, управления, т.е. в целях сохранения, совершенствования, развития системы; 4. в теории информации под информацией понимают сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний. Информация – это отражение внешнего мира с помощью знаков или сигналов. Информационная ценность сообщения заключается в новых сведениях, которые в нем содержатся (в уменьшении незнания).
Количественные характеристики информации.
1) Синтаксическая мера информации. Эта мера количества информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту. На синтаксическом уровне учитываются тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов представления информации.
2) Объём данных (V Д ) понимается в техническом смысле этого слова как информационный объём сообщения или как объём памяти, необходимый для хранения сообщения без каких-либо изменений. Информационный объём сообщения измеряется в битах и равен количеству двоичных цифр (“0” и “1”), которыми закодировано сообщение.
3) Семантическая мера информации. Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Для этого используется понятие тезаурус пользователя.
Тезаурус — это совокупность сведений, которыми располагает пользователь или система.
4)Прагматическая мера информации. Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цепи. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе.
Качественные характеристики информации.
Возможность и эффективность использования информации обусловливаются такими основными ее потребительскими показателями качества, как репрезентативность, содержательность, достаточность, доступность, актуальность, своевременность, точность, достоверность, устойчивость.
1)Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют:
• правильность концепции, на базе которой сформулировано исходное понятие;
• обоснованность отбора существенных признаков и связей отображаемого явления.
2)Содержательность информации отражает семантическую емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных, т.е.
С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных.
3)Достаточность (полнота) информации означает, что она содержит минимальный, но достаточный для принятия правильного решения состав (набор показателей). Понятие полноты информации связано с ее смысловым содержанием (семантикой) и прагматикой. Как неполная, т.е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.
4)Доступность информации восприятию пользователя обеспечивается выполнением соответствующих процедур ее получения и преобразования. Например, в информационной системе информация преобразовывается к доступной и удобной для восприятия пользователя форме. Это достигается, в частности, и путем согласования ее семантической формы с тезаурусом пользователя.
5)Актуальность информации определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информации.
6)Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.
7)Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п.
8)Достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т. е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.
9)Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности.Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.
Основные виды информации по ее форме представления, способам ее кодирования и хранения, чтоимеет наибольшее значение для информатики, это:
1)графическая или изобразительная — первый вид, для которого был реализован способ хранения информации об окружающем мире в виде наскальных рисунков, а позднее в виде картин, фотографий, схем, чертежей на бумаге, холсте, мраморе и др. материалах, изображающих картины реального мира;
2)звуковая — мир вокруг нас полон звуков и задача их хранения и тиражирования была решена с изобретение звукозаписывающих устройств в 1877 г. ее разновидностью является музыкальная информация — для этого вида был изобретен способ кодирования с использованием специальных символов, что делает возможным хранение ее аналогично графической информации;
3)текстовая — способ кодирования речи человека специальными символами — буквами, причем разные народы имеют разные языки и используют различные наборы букв для отображения речи; особенно большое значение этот способ приобрел после изобретения бумаги и книгопечатания;
4)числовая — количественная мера объектов и их свойств в окружающем мире; особенно большое значение приобрела с развитием торговли, экономики и денежного обмена; аналогично текстовой информации для ее отображения используется метод кодирования специальными символами — цифрами, причем сис-темы кодирования (счисления) могут быть разными;
5)видеоинформация — способ сохранения «живых» картин окружающего мира, появившийся с изобретением кино.
Существуют также виды информации, для которых до сих пор не изобретено способов их кодирования и хранения — это тактильная информация, передаваемая ощущениями, органолептическая, передаваемая запахами и вкусами и др.
П од современной ИТ понимается совокупность информационных процессов (сбора, передачи, обработки и т.д.), реализованных на базе вычислительной техники и средств связи и привязанных к конкретной предметной области (например, производству или организационному управлению).
Существуют следующие виды информационных процессов (фазы информационного цикла):
Сбор информации (иногда этот процесс называют восприятие или отбор информации).
Здесь осуществляется целенаправленное извлечение и анализ информации о каком-либо объекте, в результате чего формируется образ объекта, происходит его опознавание и оценка. При этом необходимо отделить интересующую нас в данном случае информацию от шумов и помех. Сбор информации может производиться или человеком, или с помощью технических средств и систем.
Простейшим видом восприятия (сбора) является различение двух противоположных состояний: наличия («да») и отсутствия («нет»), более сложным – измерение. Для обеспечения сбора путем измерения необходимы специальные технические устройства – датчики (первичные измерительные преобразователи). Для сбора информации, носителем которой является документ, традиционно используются устройства ввода в ЭВМ, такие как клавиатура, манипуляторы, диджитайзеры (digitizer) и т.п. Все чаще используется средство НИТ – оптический считыватель (сканер).
Передача (прием) информации.
Здесь информация переносится в пространстве от источника к получателю посредством тех или иных сигналов. На передающей стороне важное значение имеют такие операции, как, модуляция, кодирование, иногда аналого-цифровое преобразование (т.е. квантование по уровню и дискретизация по времени) и шифрование. На приёмной стороне осуществляется демодуляция, декодирование и восстановление непрерывного сигнала (т.е. цифро-аналоговое преобразование). Для передачи на расстояние используются каналы различной природы, самыми распространенными из которых являются электрические (обычные проводные линии) или электромагнитные (радиолинии). В НИТ все шире используется оптический канал (т.е. волоконно-оптические линии связи). Передача информации в НИТ осуществляется на базе информационных сетей.
Хранение (накопление) информации.
Это перенос информации во времени. Для этого информация должна быть зафиксирована на материальном носителе. Традиционные способы хранения информации: для текста – бумажные печатные документы, для изображений – фотография и кино, для звука – магнитная запись. НИТ предложила свои способы хранения – внешняя память ЭВМ, микрофильмирование и микрофиширование. Именно память ЭВМ обеспечивает хранение информации в виде, позволяющем получить данные по запросам пользователей в приемлемые сроки, т.е. превращает накопленную информацию в информационные ресурсы. Наиболее эффективным способом хранения информации являются базы данных.
Это упорядоченный процесс её преобразования в соответствии с некоторым алгоритмом. Здесь осуществляется выявление в информации интересующих зависимостей, сортировка, поиск и т.п. операции. Внедрение компьютерной информационной технологии обработки существенно повышает производительность труда персонала, освобождает его от рутинных операций, и часто приводит к сокращению численности работников.
В системах управления важнейшей целью обработки является решение задачи выбора управляющих воздействий. НИТ процесс обработки информации возлагает на ЭВМ, и только те процедуры, которые не поддаются формализации и требуют творческого подхода (в первую очередь процедуры принятия решения), осуществляются человеком.
Представление информации (отображение или доведение до пользователя).
Здесь осуществляется преобразование информации о процессе или объекте (обычно после её обработки) в форму, обеспечивающую оперативное и безошибочное восприятие ее человеком. Это осуществляется с помощью устройств, способных воздействовать на органы чувств человека. К ним относятся такие традиционные устройства, как индикаторы, приборы, сигнализаторы, табло, мнемосхемы, а также средства НИТ: дисплеи, устройства печати, графопостроители (плоттеры), синтезаторы звука и некоторые другие.
Совокупность этих процессов, обеспечивает работу любой информационной (автоматизированной) системы, под которой понимают человеко-компьютерную систему, использующую компьютерную информационную технологию для достижения поставленной цели (производство информационных продуктов или поддержка принятия решений).
Данные. Алгоритм, реализующий решение некоторой конкретной задачи, всегда работает с данными. Данные — это любая информация, представленная в формализованном виде и пригодная для обработки алгоритмом.
Данные, известные перед выполнением алгоритма, являются начальными, исходными данными. Результат решения задачи — это конечные, выходные данные. В задачах нахождения максимума из последовательности чисел и их произведения исходными данными являются числа, а результатами (выходными данными) — соответственно с и М.
Данные делятся на переменные и константы.
Переменные — это такие данные, значения которых могут изменяться в процессе выполнения алгоритма.
Например, для алгоритма вычисления площади круга необходимо объявить две переменные: переменную R, в которую будет заноситься значение радиуса окружности, и переменную S для вычисления площади круга по формуле
Константы — это данные, значения которых не меняются в процессе выполнения алгоритма. В примере, описанном выше, константой является число p. Каждая переменная и константа должна иметь свое уникальное имя. Имена переменных и констант задаются идентификаторами.
Идентификатор (по определению) представляет собой последовательность букв и цифр, начинающаяся с буквы.
Типы данных. С данными тесно связано понятие типа данных. Любой константе, переменной, выражению (с точки зрения обработки на ЭВМ) всегда сопоставляется некоторый тип. Тип данных характеризует множество значений, к которым относится константа и которые может принимать переменная или выражение. Например, если переменная в некотором алгоритме может принимать только значения из множества целых чисел, то ей ставится в соответствие целый тип данных.
Типы данных принято делить на простые (базовые) и структурированные.
К основным базовым типам относятся:
• целый (INTEGER) — определяет подмножество допустимых значений из множества целых чисел;
• вещественный (REAL) — определяет подмножество допустимых значений из множества вещественных чисел;
• логический (BOOLEAN) — множество допустимых значений — истина и ложь;
• символьный (CHAR) — цифры, буквы, знаки препинания и пр.
К структурным типам относятся наборы однотипных или разнотипных данных, с которыми алгоритм должен работать как с одной именованной переменной :
- чем определяются калькуляционные единицы
- чем определяются личностные характеристики определяются