martedì 26 giugno 2012

Codice Binario e introduzione ai tipi di formato (lez. del 17/03/12)

Il Bit (dall'inglese Binary Digit) è una cifra binaria,cioè un uno dei due simboli del sistema numerico binario,corrispondente a 0 e 1. Il Bit costituisce quindi l'unità elementare usata nella programmazione: tramite il raggruppamento di lunghe sequenze (dette anche stringhe) è possibile dare origine a lettere,immagini,video etc.
Essendo il Bit un'unità molto piccola,questi raggruppamenti contengono generalmente un numero di stringhe binarie pari ad una potenza binaria,pari dunque a
2^n.


L'unità di misura che però è più utilizzata in campo informatico è il Byte che corrisponde a 8 Bit. Come si può osservare dall'immagine,il numero dei Bit (in relazione al numero dei Byte) aumenta seguendo i multipli di 2.
Bit e Byte sono costituiti a loro volta da multipli,cioè numerosi raggruppamenti di sequenze binarie,che codificano moltissimi caratteri,numeri,immagini etc. a seconda della loro dimensione.
Ognuno di questi multipli ha un prefisso preciso che si ripete sia per i Bit che per i Byte; tra i più comuni possiamo trovare:
1. Kilo- (Bit o Byte) che corrisponde a 2^10
2. Mega-    " che corrisponde a 2^20
3. Giga-      " che corrisponde a 2^30
4. Tera-      " che corrisponde a 2^40
5. Peta-      " che corrisponde a 2^50
6. Hexa-     " che corrisponde a 2^60















Come già accennato in precedenza,la codifica dei codici,dà origine a informazioni in materia di numeri,caratteri,rappresentazioni audio e video.Per la codifica dei caratteri,venne creato un sistema chiamato ASCII standard,il quale identificò 128 caratteri,tra quelli più comuni e diffusi.Poichè tale sistema non aveva considerato molti caratteri come ad esempio le lettere accentate e altri tipi di alfabeto (es. alfabeto greco), venne aggiornato in una forma detta "estesa" (si parla infatti di ASCII STANDARD e ASCII EXTENDED ). Riportiamo qui di seguito le due tabelle indicanti i caratteri con i rispettivi codici.



Introduciamo adesso un altro concetto: il formato. Esso non è altro che una convenzione che viene usata per leggere,scrivere ma sopratutto interpretare il contenuto di un file; viene inoltre considerato come l'insieme delle regole con le quali viene salvato un documento.
Il formato può assumere due caratteristiche principali,infatti può essere:
Aperto se la tecnologia (riguardo tali regole) è resa pubblica e ben documentata (es.ASCII)
Proprietario se la tecnologia è posseduta in esclusiva da un soggetto,per esempio un'azienda,che ne mantiene segreto il funzionamento (es.Microsoft Word ).
In generale sono preferibili i formati aperti,per quattro ragioni fondamentali:
1. Non c'è il rischio di diffondere informazioni confidenziali (viene garantita trasparenza)
2. Viene limitata la diffusione di virus
3. Viene assicurata l'accessibilità ai file
4. Viene promossa la diversità e non vengono rafforzati i monopoli in campo informatico.

Esistono inoltre vari tipi di formato:
- FORMATO TESTO (.txt) : è un formato libero,può codificare solo testo e se si codifica in ASCII ad ogni simbolo corrisponde un Byte.
-FORMATO WORD(.doc) : è un formato proprietario,può codificare testo,immagini,musica etc.
-FORMATO RICH TEXT FORMAT (.rtf) : è un formato standard,creato da Microsoft per produrre documenti esportabili su altri word processor.Tra i programmi per leggerlo ed editarlo troviamo Abiword,Ted (solo Linux),Open Office.
-FORMATO HYPER TEXT MARKUP LANGUAGE (.htm o .html) : è un formato aperto,caratteristico delle pagine internet e creato da W3C per dare origine a standard che facilitino una maggiore diffusione.
-FORMATO EXTENSIBLE MARKUP LANGUAGE (.xml) : è un formato aperto e costituisce un nuovo standard creato da W3C.Possiede la capacità di conservare i dati indipendentemente dal programma,dal sistema operativo e dal computer usato.Open Office e Abiword utilizzano formati di scrittura dei file basati si standard xml.
-FORMATO POSTSCRIPT (.ps) : è un formato aperto realizzato da Adobe nel 1985 per creare un formato indipendente dalla stampante.
-FORMATO PORTABLE DOCUMENT FORMAT (.pdf) : è stato realizzato da Adobe nel 1990 ed ha la capacità di preservare le impostazioni dei documenti,di fondere in un unico documento oggetti diversi (testo,immagini,pagine web,etc.) e di utilizzare link come l'html.

Nessun commento:

Posta un commento