Program "polcnv"

KOPIOWANIE

Niniejszy program jest wolnym oprogramowaniem; możesz go rozprowadzać dalej i/lub modyfikować na warunkach Powszechnej Licencji Publicznej GNU (nieoficjalna wersja polska), wydanej przez Fundację Wolnego Oprogramowania - według wersji 2-giej tej Licencji lub którejś z późniejszych wersji.
Źródła aktualnej wersji polcnv.2.6.tar.gz  Freshmeat.net Źródła poprzednich wersji: polcnv.2.3.tar.gz  polcnv.2.2.tar.gz  polcnv.1.3.tar.gz
Binaria dla Solarisa (SPARC): polcnv Binaria dla DOSa: polcnv.exe - skompilowany przy pomocy Borland C
polcnv.exe - skompilowany przy pomocy GNU C obsługuje długie nazwy plików.

PRZEZNACZENIE

Program "polcnv" jest przeznaczony do konwersji plików pomiędzy rozmaitymi sposobami kodowania polskich (i nie tylko) liter. Obsługiwane sposoby kodowania:
Notacja perfiksowa z dowonie wybranym znakiem jako prefiksem. Mazowia CSK
Kodowanie zdefiniwane tablicą przez użytkownika. Microvex ATM
ISO 8859-2 Latin 2 = Polska Norma PN-93/T-42118 Cyfromat DHN
Microsoft Windows (code page 1250) IINTE-ISIS Unia
IBM Latin 2 (code page 852) IEA-Swierk Logic
ISO 10646 (UCS-4, UCS-2, UTF-7, UTF-8) ELWRO-Junior Ventura
Bez polskich liter Atari-Clamus AmigaPL
Apple Macintosh CorelDraw TeX PL
Polski Brail ISO 6937-2 Unicode 2

ZALECENIE

Jednocześnie zachęcam wszystkich do stosowania się do standardu czyli Polskiej Normy PN-93/T-42118 będącej odpowiednikiem międzynarodowego standardu ISO/IEC 10367:1991 znanego lepiej jako ISO 8859-2 (Latin 2), lub nowego standardu ISO 10646 zgodnego z normą Unicode 2.

KOMPILACJA - UNIX

  1. Rozpakować plik dystrybucyjny.
  2. Uruchomić polecenia:
    	./configure
    	make
    	make install
    	
    To ostatnie polecenie musi być wywołane z prawami niezbędnymi do umieszczenia programu w katalogu docelowym.
  3. Zabawiać się konwersją dokumentów.
Wywołując polecenie configure można użyć opcji --prefix i --datadir aby zdefiniować katalogi docelowe dla instalacji. Wartości domyślne:
prefix/usr/local
datadir$prefix/share

KOMPILACJA - DOS

  1. Rozpakować plik dystrybucyjny.
  2. Przejść do katalogu src
  3. Skopiować plik makefile.dos pod nazwę makefile .
  4. Przejżeć plik Makefile i ew. zmienić zmienne: CC, CFLAGS, COPTS
  5. Uruchomić program make
  6. Zainstalować program w dowolnym katalogu.
  7. Zabawiać się konwersją dokumentów.

ZASADA DZIAŁANIA

Wewnętrznym kodem programu jest ISO-10646 UCS-4 (równoważny Unicode UTF-32). Konwersja z kodu X na kod Y odbywa się poprzez UCS-4, czyli każdy znak najpierw kowertowany jest z kodu X do UCS-4 a natępnie z UCS-4 do kodu Y.

SPOSÓB UŻYCIA

Program ten może być używany z podaniem nazw plików wejściowego i wyjściowego lub w charakterze filtru. W obu przypadkach trzeba podać metody kodowania obu plików. Przykłady:
	polcnv -m wejście.mazowia -i wyjście.iso
	polcnv -l - -p@ wyjście.prefiksowe < wejście.ibm
	polcnv -w - -u - < wejście.windows > wyjście.unicode
Użytkownik może zdefiniować własne tabele konwersji. Program poszukuje tabel najpierw w katalogu bieżącym a następnie w katalogu "datadir" zdefiniowanym przy konfiguracji. Przykłady:
	polcnv -f mójkod.txt wejście.mójkod -i wyjście.iso
	polcnv -i wejście.iso -f mycode.txt wyjście.mójkod 
Istnieje rownież tryb testowania kodu pozwalający na wykrycie w jaki sposób został zakodowany plik wejściowy. Ponieważ ten tryb opiera się na statyskach występowania liter należy go używać ostrożnie. Przykłady:
	polcnv -t nieznane.wejście
	polcnv -t nieznane.wejście -i wyjście.iso

FORMAT TABEL KONWERSJI

Każdy znak kodu definiowany jest w osobnym wierszu. Definicja składa się z dwóch liczb szesnastkowych oddzielonych tabulatorem. Pierwsza liczba reprezentuje wartość pojedyńczego bajty definiowanego kodu. Druga liczba reprezentuje wartość równoważnego znaku w kodzie Unicode. Definicja musi zaczynać się od pierwszego znaku wiersza. Wszelkie znaki pomiędzy znakiem # a końcem wiersza są traktowane jako komentarz i ignorowane. Puste wiersze są również ignorowane. Pliki spełniające powyższą definicję można znaleźć pod adresem:
ftp://www.unicode.org/Public/MAPPINGS/
Wybrane pliki z dostępnego tam zestawu są dystrybuowane wraz z programem i instalowane w katalogu "datadir".

BŁĘDY

Informacje o błędach można wysyłać na adres: J.Sobczyk@ia.pw.edu.pl Proszę pamiętać, że autor zajmuje się tym programem w czasie wolnym od pracy i tylko w takim zakresie na jaki wolny czas pozwala.
Jerzy Sobczyk
E-mail: J.Sobczyk@ia.pw.edu.pl