Просмотр отдельных изменений
Эта страница позволяет вам проверить переменные, сгенерированные фильтром злоупотреблений, на предмет отдельного изменения.
Переменные, созданные для этого изменения
Переменная | Значение |
---|---|
Число правок участника (user_editcount ) | null |
Имя учётной записи (user_name ) | '37.23.213.223' |
Возраст учётной записи (user_age ) | 0 |
Группы (включая неявные) в которых состоит участник (user_groups ) | [
0 => '*'
] |
Права, которые есть у участника (user_rights ) | [
0 => 'createaccount',
1 => 'read',
2 => 'edit',
3 => 'createpage',
4 => 'createtalk',
5 => 'writeapi',
6 => 'viewmywatchlist',
7 => 'editmywatchlist',
8 => 'viewmyprivateinfo',
9 => 'editmyprivateinfo',
10 => 'editmyoptions',
11 => 'abusefilter-log-detail',
12 => 'urlshortener-create-url',
13 => 'centralauth-merge',
14 => 'abusefilter-view',
15 => 'abusefilter-log',
16 => 'vipsscaler-test'
] |
Редактирует ли пользователь через мобильное приложение (user_app ) | false |
Редактирует ли участник через мобильный интерфейс (user_mobile ) | false |
ID страницы (page_id ) | 70812 |
Пространство имён страницы (page_namespace ) | 0 |
Название страницы (без пространства имён) (page_title ) | 'Текстовый файл' |
Полное название страницы (page_prefixedtitle ) | 'Текстовый файл' |
Последние десять редакторов страницы (page_recent_contributors ) | [
0 => '37.23.213.223',
1 => 'Lesless',
2 => '176.59.110.36',
3 => 'Vbif-routine',
4 => 'Wisgest',
5 => '62.16.7.235',
6 => 'Alex NB IT',
7 => '89.37.25.135',
8 => 'Mercury',
9 => 'AD678F'
] |
Возраст страницы (в секундах) (page_age ) | 527360303 |
Действие (action ) | 'edit' |
Описание правки/причина (summary ) | '/* Описание */ ' |
Старая модель содержимого (old_content_model ) | 'wikitext' |
Новая модель содержимого (new_content_model ) | 'wikitext' |
Вики-текст старой страницы до правки (old_wikitext ) | '{{перенаправление|TXT}}
{{универсальная карточка}}
[[Файл:CsvDelimited001.svg|thumb|Пиктограммное описание текстового файла с [[CSV]]-данными]]
'''Те́кстовый файл''' — компьютерный [[файл]], содержащий [[текстовые данные]]. Текстовым файлам противопоставляются [[двоичный файл|двоичные (бинарные) файлы]], в которых содержатся данные, не рассчитанные на интерпретацию в качестве текстовых (например, файлы, хранящие текст в закодированном или сжатом виде, или хранящие не текст, а звук, изображение или иные данные).
В отличие от термина «текстовые данные» (текстовый формат данных), характеризующего содержимое данных, термин «текстовый файл» относится к файлу и характеризует его как контейнер, хранящий такие данные.
== Описание ==
{{основная статья|Текстовые данные}}
QE{Текстовый файл содержит последовательность [[символ]]ов (в основном [[Печатные символы|печатных знаков]], принадлежащих тому или иному [[набор символов|набору символов]]). Эти символы обычно сгруппированы в строки ({{lang-en|lines, rows}}). В современных системах строки разделяются [[перевод строки|разделителями строк]], в прошлом же применялось хранение строк в виде записей постоянной или переменной длины (см.: [[Перфокарта]]). Иногда конец текстового файла (особенно если в файловой системе не хранится информация о размере файла) также отмечается одним или более специальными знаками, известными как маркеры [[EOF|конца файла]].
=== Преимущества и недостатки ===
Преимущества:ЙУХ
* Универсальность — текстовый файл может быть прочитан (так или иначе) на любой системе или [[Операционная система|ОС]], особенно если речь идёт об однобайтных кодировках вроде [[ASCII]], которые не подвержены проблеме, характерной для других форматов файлов — для них не важна разница в [[порядок байтов|порядке байтов]] или длине [[машинное слово|машинного слова]].
* Устойчивость — каждое слово и символ в таком файле самодостаточны и, если случится повреждение байтов в таком файле, то обычно можно восстановить данные или продолжить обработку остального содержимого, в то время как у [[Сжатие данных|сжатых]] или двоичных файлов повреждение нескольких байтов может сделать файл совершенно невосстановимым. Многие [[система управления версиями|системы управления версиями]] рассчитаны на текстовые файлы и с двоичными файлами могут работать только как с единым целым.
* Формат текстового файла крайне прост и его можно изменять [[текстовый редактор|текстовым редактором]] — программой, входящей в комплект практически любой [[Операционная система|ОС]].
Недостатки:
* У больших несжатых текстовых файлов низкая [[информационная энтропия]] — эти файлы занимают больше места, нежели минимально необходимо. Хотя эта [[избыточность информации|избыточность]] и определяет повышенную устойчивость к сбоям в каналах передачи данных и при получении данных с [[Носитель информации|носителей]], например, с [[Магнитная лента|магнитной ленты]].
* Некоторые операции с текстовыми файлами неэффективны. Например, если в файле встретится число, вычислительная система до начала операций с ним должна будет перевести его в свой внутренний формат, применив сравнительно сложную процедуру конвертации числа; чтобы перейти на 1000-ю строку, требуется считать 999 строк, идущих до неё; сложно заменить одну строку другой и т. д. Поэтому при работе с [[база данных|большими объёмами данных]] текстовые файлы применяют только как промежуточный формат, обеспечивающий [[интероперабельность]].
=== Форматы, основанные на текстовых файлах ===
В силу своей простоты текстовые файлы нередко используются для хранения служебной информации (например, [[лог-файл|логов]]): так как операция добавления в конец текстового файла новых данных не требует сколь-нибудь значительных вычислительных ресурсов независимо от уже имеющегося объёма файла и вида добавляемых текстовых данных, ведение текстовых лог-файлов обычно происходит эффективно и незаметно для пользователя и для других приложений (вплоть до исчерпания дискового пространства).
Текстовый формат служит основой для многих более специализированных [[формат файла|форматов]] (например, [[.ini]], [[SGML]], [[HTML]], [[XML]], [[TeX]], [[Исходный код|исходных текстов]] языков программирования). В некоторых из таких форматов определённые сочетания символов могут использоваться как средства разметки текста. В таком случае файл может хранить форматированный текст, в котором для символов дополнительно может быть задан шрифт, начертание, размер и т. п. (например, [[Rich Text Format]], [[HTML]]).
=== Расширения имён файлов ===
В [[DOS]], [[Mac OS]] и [[Windows]] для файлов с неформатированным текстом обычно используется [[расширение имени файла|расширение]] <tt>.txt</tt>. Тем не менее, текстовыми могут являться файлы с любым другим расширением или без оного. Например, [[исходный код|исходные коды]] программ обычно хранятся в файлах с расширениями, соответствующими [[язык программирования|языку программирования]], на котором написаны программы (<tt>.java</tt>, <tt>.bas</tt>, <tt>.pas</tt>, <tt>.c</tt>).
Форматированный текст (текст с разметкой) обычно хранится в файлах с расширением, соответствующим формату или [[Язык разметки|языку разметки]] — <tt>.rtf</tt>, <tt>.htm</tt>, <tt>.html</tt>.
== Кодировки ==
=== 8-битный текст ===
{{main|Кодовая страница}}
Исторически для кодирования текстовых файлов применялись 7-[[бит]]ный набор символов [[ASCII]], а также 8-битные [[EBCDIC]] и различные расширения ASCII. В 8-битных кодовых страницах общепринято использовать в первой половине кодовой таблицы символы, соответствующие ASCII.
Преимуществом 8-битного представления текста является программная простота и независимость от проблемы [[порядок байтов|порядка байтов]] или длины [[машинное слово|машинного слова]]. Недостаток — большое количество различных стандартов, что может приводить к несовместимости.
=== Unicode в текстовых файлах ===
Применение [[Unicode]] в текстовых файлах хотя в основном решает «проблему кодировок» и стандартизирует употребление управляющих символов, но создаёт свои проблемы. В большинстве современных систем неделимой единицей информации в [[поток данных|потоке данных]] является [[октет (информатика)|байт (8 бит)]], которых для кодирования одного символа из Юникода требуется несколько. В качестве решения применяются несовместимые между собой системы [[UTF-8]] и две версии [[UTF-16]] (UTF-16LE и UTF-16BE с противоположным [[порядок байтов|порядком байтов]]). Иногда в начало файла добавляют специальный символ-маркер (U+FEFF<ref>[http://www.unicode.org/versions/Unicode5.0.0/ch02.pdf Стандарт Unicode, ч. 2.]</ref>), позволяющий распознать формат однозначно. UTF-8 имеет преимущество обратной совместимости с ASCII, однако программная обработка текста в UTF-8 усложняется непостоянным размером символа. Также тексты в Юникоде отличаются ещё большей [[избыточность информации|избыточностью]], нежели 8-битные.
=== Управляющие символы ===
{{main|Управляющие символы}}
Различные операционные системы придерживаются своего представления перевода строки и конца файла. В [[UNIX]] перевод строки состоит из одного символа LF (код 0xA), в [[Mac OS]] (но не [[OS X]]) — из символа CR (код 0xD), а в [[DOS]] и [[Windows]] перевод строки кодируется последовательностью двух символов: CR и LF.
Такой разнобой продиктован принципами работы пишущих машинок: чтобы перейти на новую строку, надо вернуть каретку в начало строки (''carriage return''), а затем провернуть барабан на одну строку (''line feed''). При печати на принтере тот и другой символ мог стоять обособленно (например, чтобы выделить строку, пропечатав её дважды, или прокрутить барабан на несколько строк), но в текстовых файлах в этом нет нужды.
Помимо названных, в текстовых файлах встречаются такие символы, как [[табуляция]] (код 9) и перевод страницы (код 0xC). Последний использовался старыми текстовыми редакторами наподобие [[Лексикон (программа)|ЛЕКСИКОН]], а также в файлах, предназначенных для распечатки на принтере.
== Примечания ==
{{примечания}}
{{Электронные книги}}
{{rq|sources|refless}}
[[Категория:Форматы файлов| ]]
[[Категория:Форматы текстовых документов]]
[[Категория:Форматы электронных книг]]' |
Вики-текст новой страницы после правки (new_wikitext ) | '{{перенаправление|TXT}}
{{универсальная карточка}}
[[Файл:CsvDelimited001.svg|thumb|Пиктограммное описание текстового файла с [[CSV]]-данными]]
'''Те́кстовый файл''' — компьютерный [[файл]], содержащий [[текстовые данные]]. Текстовым файлам противопоставляются [[двоичный файл|двоичные (бинарные) файлы]], в которых содержатся данные, не рассчитанные на интерпретацию в качестве текстовых (например, файлы, хранящие текст в закодированном или сжатом виде, или хранящие не текст, а звук, изображение или иные данные).
В отличие от термина «текстовые данные» (текстовый формат данных), характеризующего содержимое данных, термин «текстовый файл» относится к файлу и характеризует его как контейнер, хранящий такие данные.
== Описание ==
{{основная статья|Текстовые данные}}
QE{Текстовый файл содержит последовательность [[символ]]ов (в основном [[Печатные символы|печатных знаков]], принадлежащих тому или иному [[набор символов|набору символов]]). Эти символы обычно сгруппированы в строки ({{lang-en|lines, rows}}). В современных системах строки разделяются [[перевод строки|разделителями строк]], в прошлом же применялось хранение строк в виде записей постоянной или переменной длины (см.: [[Перфокарта]]). Иногда конец текстового файла (особенно если в файловой системе не хранится информация о размере файла) также отмечается одним или более специальными знаками, известными как маркеры [[EOF|конца файла]].
=== Преимущества и недостатки ===
Преимущества:ЙУХ ЙУХ ЙУХ ЙУХ ЙУХ ЙУХ ЙУХ ЙУХ
* Универсальность — текстовый файл может быть прочитан (так или иначе) на любой системе или [[Операционная система|ОС]], особенно если речь идёт об однобайтных кодировках вроде [[ASCII]], которые не подвержены проблеме, характерной для других форматов файлов — для них не важна разница в [[порядок байтов|порядке байтов]] или длине [[машинное слово|машинного слова]].
* Устойчивость — каждое слово и символ в таком файле самодостаточны и, если случится повреждение байтов в таком файле, то обычно можно восстановить данные или продолжить обработку остального содержимого, в то время как у [[Сжатие данных|сжатых]] или двоичных файлов повреждение нескольких байтов может сделать файл совершенно невосстановимым. Многие [[система управления версиями|системы управления версиями]] рассчитаны на текстовые файлы и с двоичными файлами могут работать только как с единым целым.
* Формат текстового файла крайне прост и его можно изменять [[текстовый редактор|текстовым редактором]] — программой, входящей в комплект практически любой [[Операционная система|ОС]].
Недостатки:
* У больших несжатых текстовых файлов низкая [[информационная энтропия]] — эти файлы занимают больше места, нежели минимально необходимо. Хотя эта [[избыточность информации|избыточность]] и определяет повышенную устойчивость к сбоям в каналах передачи данных и при получении данных с [[Носитель информации|носителей]], например, с [[Магнитная лента|магнитной ленты]].
* Некоторые операции с текстовыми файлами неэффективны. Например, если в файле встретится число, вычислительная система до начала операций с ним должна будет перевести его в свой внутренний формат, применив сравнительно сложную процедуру конвертации числа; чтобы перейти на 1000-ю строку, требуется считать 999 строк, идущих до неё; сложно заменить одну строку другой и т. д. Поэтому при работе с [[база данных|большими объёмами данных]] текстовые файлы применяют только как промежуточный формат, обеспечивающий [[интероперабельность]].
=== Форматы, основанные на текстовых файлах ===
В силу своей простоты текстовые файлы нередко используются для хранения служебной информации (например, [[лог-файл|логов]]): так как операция добавления в конец текстового файла новых данных не требует сколь-нибудь значительных вычислительных ресурсов независимо от уже имеющегося объёма файла и вида добавляемых текстовых данных, ведение текстовых лог-файлов обычно происходит эффективно и незаметно для пользователя и для других приложений (вплоть до исчерпания дискового пространства).
Текстовый формат служит основой для многих более специализированных [[формат файла|форматов]] (например, [[.ini]], [[SGML]], [[HTML]], [[XML]], [[TeX]], [[Исходный код|исходных текстов]] языков программирования). В некоторых из таких форматов определённые сочетания символов могут использоваться как средства разметки текста. В таком случае файл может хранить форматированный текст, в котором для символов дополнительно может быть задан шрифт, начертание, размер и т. п. (например, [[Rich Text Format]], [[HTML]]).
=== Расширения имён файлов ===
В [[DOS]], [[Mac OS]] и [[Windows]] для файлов с неформатированным текстом обычно используется [[расширение имени файла|расширение]] <tt>.txt</tt>. Тем не менее, текстовыми могут являться файлы с любым другим расширением или без оного. Например, [[исходный код|исходные коды]] программ обычно хранятся в файлах с расширениями, соответствующими [[язык программирования|языку программирования]], на котором написаны программы (<tt>.java</tt>, <tt>.bas</tt>, <tt>.pas</tt>, <tt>.c</tt>).
Форматированный текст (текст с разметкой) обычно хранится в файлах с расширением, соответствующим формату или [[Язык разметки|языку разметки]] — <tt>.rtf</tt>, <tt>.htm</tt>, <tt>.html</tt>.
== Кодировки ==
=== 8-битный текст ===
{{main|Кодовая страница}}
Исторически для кодирования текстовых файлов применялись 7-[[бит]]ный набор символов [[ASCII]], а также 8-битные [[EBCDIC]] и различные расширения ASCII. В 8-битных кодовых страницах общепринято использовать в первой половине кодовой таблицы символы, соответствующие ASCII.
Преимуществом 8-битного представления текста является программная простота и независимость от проблемы [[порядок байтов|порядка байтов]] или длины [[машинное слово|машинного слова]]. Недостаток — большое количество различных стандартов, что может приводить к несовместимости.
=== Unicode в текстовых файлах ===
Применение [[Unicode]] в текстовых файлах хотя в основном решает «проблему кодировок» и стандартизирует употребление управляющих символов, но создаёт свои проблемы. В большинстве современных систем неделимой единицей информации в [[поток данных|потоке данных]] является [[октет (информатика)|байт (8 бит)]], которых для кодирования одного символа из Юникода требуется несколько. В качестве решения применяются несовместимые между собой системы [[UTF-8]] и две версии [[UTF-16]] (UTF-16LE и UTF-16BE с противоположным [[порядок байтов|порядком байтов]]). Иногда в начало файла добавляют специальный символ-маркер (U+FEFF<ref>[http://www.unicode.org/versions/Unicode5.0.0/ch02.pdf Стандарт Unicode, ч. 2.]</ref>), позволяющий распознать формат однозначно. UTF-8 имеет преимущество обратной совместимости с ASCII, однако программная обработка текста в UTF-8 усложняется непостоянным размером символа. Также тексты в Юникоде отличаются ещё большей [[избыточность информации|избыточностью]], нежели 8-битные.
=== Управляющие символы ===
{{main|Управляющие символы}}
Различные операционные системы придерживаются своего представления перевода строки и конца файла. В [[UNIX]] перевод строки состоит из одного символа LF (код 0xA), в [[Mac OS]] (но не [[OS X]]) — из символа CR (код 0xD), а в [[DOS]] и [[Windows]] перевод строки кодируется последовательностью двух символов: CR и LF.
Такой разнобой продиктован принципами работы пишущих машинок: чтобы перейти на новую строку, надо вернуть каретку в начало строки (''carriage return''), а затем провернуть барабан на одну строку (''line feed''). При печати на принтере тот и другой символ мог стоять обособленно (например, чтобы выделить строку, пропечатав её дважды, или прокрутить барабан на несколько строк), но в текстовых файлах в этом нет нужды.
Помимо названных, в текстовых файлах встречаются такие символы, как [[табуляция]] (код 9) и перевод страницы (код 0xC). Последний использовался старыми текстовыми редакторами наподобие [[Лексикон (программа)|ЛЕКСИКОН]], а также в файлах, предназначенных для распечатки на принтере.
== Примечания ==
{{примечания}}
{{Электронные книги}}
{{rq|sources|refless}}
[[Категория:Форматы файлов| ]]
[[Категория:Форматы текстовых документов]]
[[Категория:Форматы электронных книг]]' |
Унифицированная разница изменений правки (edit_diff ) | '@@ -11,5 +11,5 @@
=== Преимущества и недостатки ===
-Преимущества:ЙУХ
+Преимущества:ЙУХ ЙУХ ЙУХ ЙУХ ЙУХ ЙУХ ЙУХ ЙУХ
* Универсальность — текстовый файл может быть прочитан (так или иначе) на любой системе или [[Операционная система|ОС]], особенно если речь идёт об однобайтных кодировках вроде [[ASCII]], которые не подвержены проблеме, характерной для других форматов файлов — для них не важна разница в [[порядок байтов|порядке байтов]] или длине [[машинное слово|машинного слова]].
* Устойчивость — каждое слово и символ в таком файле самодостаточны и, если случится повреждение байтов в таком файле, то обычно можно восстановить данные или продолжить обработку остального содержимого, в то время как у [[Сжатие данных|сжатых]] или двоичных файлов повреждение нескольких байтов может сделать файл совершенно невосстановимым. Многие [[система управления версиями|системы управления версиями]] рассчитаны на текстовые файлы и с двоичными файлами могут работать только как с единым целым.
' |
Новый размер страницы (new_size ) | 14261 |
Старый размер страницы (old_size ) | 14212 |
Изменение размера в правке (edit_delta ) | 49 |
Добавленные в правке строки (added_lines ) | [
0 => 'Преимущества:ЙУХ ЙУХ ЙУХ ЙУХ ЙУХ ЙУХ ЙУХ ЙУХ'
] |
Удалённые в правке строки (removed_lines ) | [
0 => 'Преимущества:ЙУХ'
] |
Все внешние ссылки, добавленные в правке (added_links ) | [] |
Все внешние ссылки в новом тексте (all_links ) | [
0 => 'http://www.unicode.org/versions/Unicode5.0.0/ch02.pdf',
1 => '//www.wikidata.org/wiki/Q59154746?uselang=ru'
] |
Ссылки на странице до правки (old_links ) | [
0 => '//www.wikidata.org/wiki/Q59154746?uselang=ru',
1 => '//www.wikidata.org/wiki/Q59154746?uselang=ru',
2 => 'http://www.unicode.org/versions/Unicode5.0.0/ch02.pdf'
] |
Была ли правка сделана через выходной узел сети Tor (tor_exit_node ) | false |
Unix-время изменения (timestamp ) | 1651045774 |