Digitális bölcsészet alapok
Az alábbiakban összegyűjtött tudásanyag az ELTE Digitális Bölcsészet Tanszék (ELTE-DH) és Digitális Örökség Nemzeti Laboratórium (DH-LAB) által a digitáls bölcsészet műveléséhez elengedhetetlen szakmai kompetenciák elsajátításához és elmélyítéséhez kíván hozzájárulni. Fontosnak tartjuk, hogy ezen szakmai tudásbázis szerkesztett formában, egy helyen, szabadon elérhető legyen mindenki számára.
A közzétett anyag folyamatosan bővül és frissül új témákkal a mindennapi gyakorlatnak megfelelően. Szívesen vesszük a hozzászólásokat, hibajavításokat, kiegészítéseket.
Tartalomjegyzék
- Karakterkódolás
- Bevezetés
- Absztrakciós szintek
- A karakterkódolás története
- ASCII
- Az ISO 8859 család
- Nemzetköziesítés hackeléssel
- A Unicode szemlélete
- A Unicode reprezentációk
- Élet egy bájton túl (a széles karakterek és az UTF-16/32)
- A bitek sorrendje a széles karakterekben (big endian, little endian és a byte order mark)
- UTF-8, a több bájtos, nem fix szélességű karakterkódolás
- Melyik reprezentáció mire jó?
- A karakterreprezentáció-konverziós hibák és a betűszemét (mojibake)
- Karakterkódolás a gyakorlatban
- ASCII karakterhivatkozások (fehérszóközök)
- Unicode karakterhivatkozások
- Kódtáblafüggetlen karakterhivatkozások előállítása és feloldása
- A Base64 kódolás
- A Quoted-Printable kódolás
- Ékezetes fájlneveket tartalmazó ZIP archívum kitömörítése
- Különféle sorvégek
- Lokalizáció és rendezés
- Kis- és nagybetűsítés
- A BOM (byte order mark)
- A Python hozzáállása a bájtokhoz és karakterekhez
- A fájlok kódolásának explicit megadása
- Kódolási hibák, furcsaságok
- Karakterek nyomtatásbeli szélességének meghatározása
- A feltételes kötőjel kiszedése a szövegből
- Nem Unicode kompatibilis parancsok futtatása
- ASCII rajzok és videók
- Impresszum