Date Редакция Категория comp Теги linux / LaTeX / TeX / Office / word

LibreOffice

На начальном уровне использования LibreOffice мало чем отличается от MS Word. Например, может не сработать привычная комбинация клавиш и понадобиться выполнить команду через меню. Как правило, подобные заминки не превышают нескольких секунд. Вот то, что у меня вышло за эти пределы:

  • Перейти к заданной странице можно с помощью Навигатора (Navigator), вызвать который можно клавишей F5 или меню View/Navigator.

Я сознательно не перехожу на русский язык интерфейса, хотя это легко настроить.

TeX

Исходный файл tex выглядит примерно так (sample.tex):

\documentclass[a4paper,12pt]{article}
\usepackage[T2A]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[russian,english]{babel}

\begin{document}
This is our first LaTeX document.

Это наш первый документ ЛаТеХ.
\end{document}

Сохраняем это в файле с расширением .tex, например sample.tex. В Texmaker'е для компиляции документов и просмотра результатов используется меню Инструменты*. Его пункты:

  • LaTeX (F2) компиляция документа, результирующий файл в формате dvi
  • Просмотр DVI (F3) просмотр результата
  • PDFLaTeX (F6) компиляция документа, результирующий файл в формате pdf
  • Просмотр PDF (F7)

Результат компиляции sample.tex — sample.dvi

Результат компиляции sample.tex — sample.pdf

Мне также понадобился mfpic — пакет для рисования картинок средствами Metafont/Metapost. Для его установки добавил из дистрибутива пакет texlive-metapost.

Конвертация текста

В наследство от Windows остались текстовые файлы в досовской и виндоусовской кодировках. Для их конвертации в UTF-8 можно написать простенький скрипт на Python (так я вначале и поступил) или воспользоваться командой iconv. Из Windows-1251 в UTF-8 это делается так:

iconv -f windows-1251 -t utf8 file > newfile

Обозначения кодировок в iconv (полный список: iconv --list):

Название кодировки Обозначение в iconv
Windows-1251 windows-1251, cp1251
DOS cp866 866, csibm866
KOI-8R koi8r, koi8-r

Словари en-ru, ru-en и толковый

До сих пор задача решалась GoldenDict'ом и конвертированными из Lingvo словарями. Однако, исследуя установленный в Xubuntu по умолчанию софт, выяснилось, что есть другой путь: использование протокола dict. Клиент dict — xfce-dict — уже установлен (Меню приложений/Офис/Словарь), что дает нам доступ к онлайновым словарям. Для доступа к словарям на диске нужно установить локальный сервер словарей dictd.

Установка MS Office 2007

Если конкретно, то мне нужно получать тексты в формате MS Word с формулами, которые можно было бы редактировать в других Word'ах. Как вставить один Equation Editor в LibreOffice или подобный ему свободный пакет я не знаю, поэтому пришлось устанавливать весь Word.

Итак, приступим.

Установка Wine

Виртуальную машину с Windows ставить хотелось еще меньше, чем Word, поэтому ограничимся меньшим... софтом — Wine — загрузчиком программ Windows в Linux.

Установить его можно через Центр приложений и, поскольку я ставлю довольно старую версию Office, то я поступил именно так.

Желающие могут добавить PPA-репозиторий с новейшей версией Wine:

sudo add-apt-repository ppa:ubuntu-wine/ppa
sudo apt-get update

и установить ее:

sudo apt-get install wine1.5

где номер версии (1.5) может отличаться.

Кроме того, можно проверить, насколько хорошо Wine поддерживает нужное вам приложение. На сайте Wine есть база приложений (AppDB), поискав в которой по имени приложения, можно найти сведения о его поддержке (Словесные характеристики Platinum, Gold, Silver, думаю понятны. Кроме того, рядом указывается номер версии Wine, для которой обеспечена такая поддержка).

MS Office 2007 поддерживался еще Wine 1.3, а в моем Центре приложений предлагается 1.4, так что — вперед.

Настройка Wine

После установки Wine, в Меню приложений появится новый пункт — Wine. Нас интересует Wine/Настройка Wine (любители консоли могут набрать в ней winecfg, чтобы получить тот же результат).

Во вкладке "Приложения" выбираем версию Windows — Windows XP.

Во вкладке "Библиотеки" выбираем в списке "Новое замещение для библиотеки" — riched20.dll и нажимаем "Установить". Теперь кликаем на только что добавленную библиотеку, нажимаем "Изменить", выбираем пункт "Сторонняя (Windows)" и нажимаем "OK".

Вкладка *Библиотеки* настроек *Wine*.

Наконец, в самом окне настройки Wine нажимаем "OK".

Находим установочный файл Microsoft Office 2007 — setup.exe, и, кликнув по нему правой кнопкой, запускаем его при помощи Wine.

Установка MS Office

В начале установки не забываем кликнуть "Настройки", чтобы выбрать нужные средства MS Office. Для меня это — Word и Редактор формул. Далее идет обычная установка.

В результате, в Wine/Programs появляется пункт Microsoft Office, где можно выбрать Word, настроить его нужным вам образом и использовать.

Удобно создать на рабочем столе ярлык для запуска средств Office, скопировав нужный ярлык из Главного меню.

Где это все находится

В каталоге пользователя:

`~/.wine/drive_c/`

там находится то, что установлено на диске С: вашей псевдо-Windows. В случае Office, ищем Program Files/Microsoft Office..., т. е. действуем по аналогии с Windows.

Шрифт в формулах

Формулы, вставленные в Word, работающем под Wine, выглядят корректно, за исключением замены символа вектора (стрелочки) на букву "r". Та же проблема возникает и при отображении вордовских документов в LibreOffice.

Проблема связана с недостатком шрифта MT Extra. После его установки всё исправилось.

Установка шрифтов

  1. Существуют готовые пакеты шрифтов, которые можно установить как обычные пакеты Ubuntu. Например, можно поискать в Synaptic TrueType-шрифты — имена пакетов начинаются с ttf-
  2. Шрифты можно установить вручную. Для этого нужные шрифты помещаются в каталог ~/.fonts (если этого каталога нет, создаём его), после чего нужно выполнить
sudo fc-cache -fv

чтобы система отработала изменения. fc-cache — команда, создающая индекс файлов шрифтов на машине (или в заданном каталоге).

Установка шрифтов и Wine

Wine ищет шрифты в следующих каталогах:

  1. стандартном каталоге системных шрифтов: /usr/share/fonts. Сюда устанавливаются пакеты шрифтов, но вручную лучше ничего не добавлять.
  2. собственном каталоге шрифтов: /usr/share/wine/fonts. Здесь могут находится шрифты, предназначенные только для Wine, например, marlett, symbol и tahoma, которые нужды для работы Windows-приложений.
  3. каталоге ~/.fonts. Вот сюда удобно добавлять шрифты вручную. Это могут быть, в частности, шрифты, скачанные из Интернет или скопированные из дистрибутивов Windows. В случае, если один и тот же шрифт находится в нескольких местах, Wine предпочитает использовать шрифты из этого каталога.

Удаление Wine

Хотя Wine в своем меню предлагает удалять установленные Windows-программы, такое удаление не всегда проходит успешно. Если нужно удалить какую-то одну программу, можно просто удалить ее каталог из ~/.wine/drive_c/, а при удалении Wine – удалить указанный выше каталог целиком.

Органайзер

Устанавливаемый по умолчанию Календарь Orage (меню Офис/Календарь Orage).

DJVU

Как скопировать текст из DJVU

В Windows текст из djvu-файлов (если конечно в них был текстовый слой) можно скопировать или экспортировать с помощью STDUViewer. Программа Evince (в русской версии: Просмотр документов) в настоящее время таких возможностей не даёт. Но!

Скопировать фрагмент текста можно с помощью просмотрщика DjView4 из пакета DjVuLibre. Эта же программа позволяет конвертировать DJVU в pdf или набор графических файлов.

Как экспортировать текстовый слой

Экспортировать текстовый слой позволяет утилита djvutxt из DjVuLibre.

Установка DjVuLibre:

sudo apt-get install djvulibre-bin

Конвертация из DJVU в текстовый файл:

djvutxt input.djvu output.txt

Как извлечь нужные страницы из DJVU

Здесь возможны два варианта:

  1. Сохранение извлечённых страниц в формате DJVU
  2. Экспорт извлечённых страниц в PDF или графические форматы (PNG, JPEG и др.).

В обоих случаях поможет DjView4:

  1. Сохранение в DJVU: File -> Save as...
  2. Экспорт: File -> Export...

Объединить DJVU файлы в единый файл

Утилита djvm из DjVuLibre.

Логика работы с DJVU, я думаю, понятна: ищете то, что вам нужно в DjVuLibre.

PDF

Как скопировать текст из pdf

Установленной по умолчанию программой Evince (В русской версии: Просмотр документов).

Как извлечь нужные страницы из pdf в Ubuntu

Простейший способ — распечатать нужные страницы в pdf-файл.

Распечатка документа в pdf-файл.

Способ на 30 секунд посложнее. Спасительный пакет называется pdftk. Устанавливаем его (на это и тратятся указанные секунды):

sudo apt-get install pdftk

Чтобы извлечь из pdf-файла и сохранить нужные страницы, используем команду:

pdftk book.pdf cat 122-130 131 133 output result.pdf

book.pdf — исходный файл; 122-130 131 133 — страницы, которые будут извлечены; result.pdf — конечный файл.

Внимание! pdftk "не любит" русских букв в путях к файлам.

Как соединить несколько PDF в один файл

Чтобы соединить несколько pdf в один выполняем:

pdftk 1.pdf 2.pdf 3.pdf cat output merged.pdf

Чтобы объединить все файлы в папке:

pdftk *.pdf cat output merged.pdf

Больше примеров работы с pdftk.

Распознавание текста

  1. Существует свободная программа распознавания текста Tesseract. Устанавливаем версию > 3.
  2. Установим пакет tesseract-ocr-rus для русского языка.
  3. Tesseract работает из командной строки, поэтому, для удобства работы, нужно скачать графическую оболочку: YAGF или OCRFeeder.
    • При установке YAGF одновременно устанавливается и Tesseract. Недостатки: YAGF "съедает" абзацы, иногда "падает".
    • OCRFeeder — нужен >0.7.11, в нём язык распознавания автоматически устанавливается как русский.

Как преобразовать CHM в HTML

CHM (Compiled HTML) — формат файлов разработанный компанией Microsoft. Для его конвертации в обычный HTML будем использовать программу extract_chmLib из пакета libchm-bin.

Устанавливаем пакет:

sudo apt-get install libchm-bin

Процесс конвертации из CHM в HTML:

extract_chmLib file.chm output-dir/

html-файлы, полученные из file.chm, будут находиться в каталоге output-dir.

Напоминалка

Напоминалка, она же — органайзер, поставляется вместе с Xubuntu. Это — Orage (Главное меню/Офис/Календарь Orage). Лучше добавить его в автозапуск (Главное меню/Диспетчер настроек -> Сеансы и запуск -> Автозапуск приложений). Для проигрывания звукового сигнала в параметрах программы (Параметры/Звуковая команда) нужно указать плеер. Я использую mplayer.



Комментарии

comments powered by Disqus