работы_с_текстом

Работа с текстом

Регулярные выражения (англ. regular expressions) – формальный язык поиска и осуществления манипуляций с подстроками в тексте, основанный на использовании метасимволов (символов-джокеров, англ. wildcard characters). Для поиска используется строка-образец (англ. pattern, по-русски её часто называют «шаблоном», «маской»), состоящая из символов и метасимволов и задающая правило поиска. Для манипуляций с текстом дополнительно задаётся строка замены, которая также может содержать в себе специальные символы.

aspell – интерактивная проверка орфографии

AWK – C-подобный скриптовый язык построчного разбора и обработки входного потока (например, текстового файла) по заданным шаблонам (регулярным выражениям).

cat – (от англ. concatenate) — утилита UNIX, выводящая последовательно указанные файлы (или устройства), таким образом, объединяя их в единый поток. Если вместо имени файла указывается -, то читается стандартный ввод.

comm – построчное сравнение двух сортированных файлов

сsplit – разбивает файлы на фрагменты, опираясь на контекст

cut – удаление фрагментов из всех строк в файлах

diff – построчное сравнение файлов

fgrep – относится к семейству команд grep. Однако, fgrep использует для поиска шаблона – фиксированные строки, вместо регулярных выражений. Отсюда и название команды fgrep (Fixed GREP).

fmt – unix-утилита, переформатирует каждый абзац в файле(-ах) и выводит на стандартный вывод

fold – выполняет перенос строк, ограничивая их указанной длиной

iconv – утилита UNIX (и одноимённая библиотека) для преобразования текста из одной кодировки в другую. Также портирована под Windows.

join – объединение строк из двух файлов по общему полю

nl – нумерует строки

paste – слияние строк из файлов

patch – применение diff-файла к оригиналу

printf – форматирование и вывод данных

sort – простая и очень полезная команда, которая меняет порядок строк в текстовом файле, то есть осуществляет их сортировку по алфавиту или в соответствии с числовыми значениями.

sdiff– выводит различия между файлами, что называется, «бок о бок»

sed – (от англ. Stream EDitor) потоковый текстовый редактор (а также язык программирования), применяющий различные предопределённые текстовые преобразования к последовательному потоку текстовых данных.

split – разбивает файлы на фрагменты

tr – (от англ. translate или transliterate) — Unix-утилита для преобразования символов. В отличие от большинства других программ командной строки, команда tr не принимает имен файлов в качестве аргумента. Ввод команды tr осуществляется или со стандартного ввода, или с вывода других программ путем перенаправления.

uniq – выявление или удаление повторяющихся строк

wc – вывод числа строк, слов и байтов

  • работы_с_текстом.txt
  • Последнее изменение: 2022/11/18 08:44
  • admin