User Tools

Site Tools


обработка_текста

Обработка текста

Все Unix-подобные операционные системы широко используют текстовые файлы для хранения данных разных типов. Этим объясняется такое большое разнообразие инструментов обработки текста. В этой статье рассмотрим программы, которые используются для выполнения самых разных манипуляций с текстом.

  • cat – объединяет файлы и выводит их в стандартный вывод;
  • sort – сортирует строки из текстовых файлов;
  • uniq – сообщает о повторяющихся строках или удаляет их;

Нарезка и перетасовка текста

Далее обсудим три программы, которые используются для выделения колонок текста из файлов и их компоновки различными способами.

  • cut – удаляет фрагменты из каждой строки в файлах;
  • join – объединяет строки из двух файлов по общему полю;
  • paste – выполняет слияние строк из файлов;

Сравнение текста

Довольно часто бывает необходимо сравнить версии текстовых файлов. Для системных администраторов и разработчиков программного обеспечения это особенно важно. Системному администратору, например, может понадобиться сравнить имеющийся конфигурационный файл с предыдущей версией, чтобы понять суть возникшей проблемы. Аналогично, программисту часто бывает необходимо увидеть изменения, происшедшие в программе с течением времени.

  • comm – выполняет построчное сравнение двух сортированных файлов;
  • diff – выполняет построчное сравнение файлов;
  • patch – применяет diff-файл (файл с результатами сравнения командой diff) к оригиналу;

Редактирование на лету

В Linux есть возможность не интерактивным способом редактировать текст. Вполне возможно, например, применить серию изменений к множеству файлов всего одной командой

  • tr – перекодирует или удаляет символы;
  • sed – потоковый редактор для фильтрации и преобразования текста;
  • aspell – интерактивная программа проверки орфографии.
обработка_текста.txt · Last modified: 2023/04/06 10:28 (external edit)