Sys.command "ocaml -version";;
La question de programmation pour ce texte était donnée en question II.1 et II.2 en page 7 :
"II.1) Écrire un programme de décodage, qui prend en entrée une suite de caractère codant un symbole (avec une erreur possible), et qui renvoie ce symbole."
"II.2) Écrire un programme qui décode une suite de symboles."
On veut vérifier, numériquement, que le nombre de stratégies pour le jeu à $n$ joueurs, annoncé à $3^{(n 2^{n-1})}$, vaut bien $531441$ pour $n=3$, et de l'ordre de $1.853 \; 10^{15}$ pour $n=4$.
let denombrement_regles n =
3. ** (n *. (2. ** (n -. 1.)));;
denombrement_regles 3.;;
denombrement_regles 4.;;
C'est bon. C'était inutile, mais autant s'échauffer sur un petit truc rapide et facile.
Comme toujours, on commence par proposer des structures de données (et déclarer des types) adaptés au problème.
Ici, il nous faut un type de donnée pour les caractères (0
ou 1
), les suites de caractères (e.g., 0011
), et les symboles (e.g., 'A'
).
type caractere = int;;
type suite_caracteres = caractere array;;
type symbole = string;;
On préfère utiliser des tableaux plutôt que des listes puisque leur taille sera fixe, et qu'aucune récursion ne semble utile ici.
Plutôt que de restreindre les symboles à être des char
(une seule lettre), on autorise directement des chaînes entières.
Ensuite, il faut une structure de données qui représente le codage de Hamming, c'est-à-dire la liste des suites de caractère associé à un symbole.
Map
), mais c'est un peu trop compliqué pour l'utilisation simple qu'on va en faire.(suite, symbole)
, et l'association d'une suite de caractère à son symbole utilisera List.assoc
.type codage = (suite_caracteres * symbole);;
type codage_hamming = codage list;;
On peut commencer par définir les exemples du textes (page 5).
let n = 7 ;;
let suite1 : suite_caracteres = [| 0;0;0;0;0;0;0 |];;
let suite2 : suite_caracteres = [| 1;1;1;1;1;1;1 |];;
let suite3 : suite_caracteres = [| 0;1;0;1;0;1;0 |];;
let suite4 : suite_caracteres = [| 1;0;1;0;1;0;1 |];;
let codage_ex1 : codage_hamming = [
(suite1, "A");
(suite2, "B");
(suite3, "C");
(suite4, "D")
];;
L'association se fait facilement :
let quel_symbole (code : codage_hamming) (suite : suite_caracteres) : symbole =
List.assoc suite code
;;
quel_symbole codage_ex1 suite3;; (* = "C" *)
Pourquoi a-t-on besoin de définir un codage (liste des séquences et de leur symbole associé) ?
Et bien tout simplement parce que l'algorithme de décodage demandé en Q.II.2) nécessite de connaître le codage, pour savoir quelle séquence doit être associé à une séquence donnée (quelle erreur a été commise).
L'algorithme en question est assez simple à concevoir :
code
(supposé de Hamming), et une séquence de caractère seq
.seq
par le codage de Hamming code
.Il fonctionnera comme ça :
seq_i
du codage, vérifie si seq
a été obtenue depuis seq_i
par une et une seule modification d'un caractère (fonction est_issue
),seq_i
valide a été trouvée, alors le symbole associé par code
à seq_i
est celui associé à seq
,Assert_failure
).L'algorithme décrit ci-dessus ne fait que des boucles for
sur l'ensemble des séquences du codage de Hamming, et sur les caractères, donc termine (évidemment).
Si la séquence d'entrée a effectivement été obtenue par une modification d'un seul caractère d'une des séquence du codage d'entrée, l'hypothèse de Hamming impose que l'algorithme va la trouver, et qu'il n'en existe qu'une. Donc le symbole renvoyé par l'algorithme décrit ci-dessus est correct.
En mémoire, il n'utilise qu'au maximum une mémoire égale à celle de son entrée, donc l'algorithme de décodage d'une séquence est linéaire en mémoire.
En temps, les deux boucles for
imbriquées sont en $\mathcal{O}(N)$ pour la boucle sur les N
séquences de caractères du codage, et en $\mathcal{O}(n)$ pour chaque caractère des séquences, soit en $\mathcal{O}(N n)$ finalement, ce qui est de l'ordre de la taille du codage, donc l'algorithme de décodage d'une séquence est aussi linéaire en temps.
est_issue_de
¶On écrit chaque morceau, un par un.
On a besoin de pouvoir extraire un sous-tableau en enlevant juste une case.
let sans_j tab j =
let n = Array.length tab in
let indice i =
if i < j then i else i + 1
in Array.init (n - 1) (fun i -> tab.(indice i))
(* Autre approche :
let gauche = j
and droite = n - j - 1
in
Array.append
(Array.init gauche (fun i -> tab.(i)))
(Array.init droite (fun i -> tab.(j + i + 1)))
*)
;;
Note : Ici, j'ai préféré utiliser une fonction qui renvoie
tab.(i)
ou bientab.(i + 1)
selon quei < j
ouj < i
, mais on pourrait aussi faire deux tableaux, et les concaténer avecArray.append
.
sans_j [|0;1;2;3|] 0;;
sans_j [|0;1;2;3|] 1;;
sans_j [|0;1;2;3|] 2;;
sans_j [|0;1;2;3|] 3;;
Ensuite, il nous faut pouvoir établir que deux tableaux sont égaux (case par case).
C'est déjà le cas, via le test =
en Caml :
[|1;2;3|] = [|3;4;1|];;
[|1;2;3|] = [|1;2;3|]
Donc on peut facilement vérifier si une séquence seq
a été issue depuis seq_i
par une modification de la case numéro j
:
let est_issue_de_en_j (seq_i : suite_caracteres) (seq : suite_caracteres) (j : int) =
let seq_i_sansj = sans_j seq_i j in
let seq_sansj = sans_j seq j in
seq_i_sansj = seq_sansj
;;
suite1;;
est_issue_de_en_j suite1 suite1 0;;
let suite1_delta0 = [|1; 0; 0; 0; 0; 0; 0|];;
est_issue_de_en_j suite1 suite1_delta0 0;;
est_issue_de_en_j suite1 suite1_delta0 1;;
est_issue_de_en_j suite1 suite1_delta0 4;;
est_issue_de_en_j suite1 suite1_delta0 6;;
let suite1_delta5 = [|0; 0; 0; 0; 0; 1; 0|];;
est_issue_de_en_j suite1 suite1_delta5 3;;
est_issue_de_en_j suite1 suite1_delta5 4;;
est_issue_de_en_j suite1 suite1_delta5 5;;
est_issue_de_en_j suite1 suite1_delta5 6;;
Pour finir, il faut vérifier qu'un et un seul indice j
est valide.
let est_issue_de (seq_i : suite_caracteres) (seq : suite_caracteres) =
let taille = Array.length seq_i in
let bon_j = ref (-1) in
let nb_bon_j = ref 0 in
(* Pour chaque *)
for j = 0 to taille - 1 do
if est_issue_de_en_j seq_i seq j
then begin
bon_j := j;
(* s'ils diffèrent en cette case, ie si une vraie modification était nécessaire *)
if seq_i.(j) != seq.(j) then
incr nb_bon_j;
end;
done;
(* Vérifie qu'au maximum une vraie modification a été utilisée *)
assert (!nb_bon_j <= 1);
(* 0 <= !bon_j, !bon_j, !nb_bon_j *) (* pour tester *)
0 <= !bon_j
;;
est_issue_de suite1 suite1;;
est_issue_de suite1 suite1_delta0;;
est_issue_de suite1 suite1_delta5;;
let suite1_4delta = [|1; 1; 0; 1; 0; 1; 0|];;
est_issue_de suite1 suite1_4delta;; (* false *)
decodage_une_sequence
¶La même architecture peut-être utilisée :
let decodage_une_sequence (code : codage_hamming) (seq : suite_caracteres) : symbole =
let bon_indice = ref (-1) in
let nb_bonne_seqi = ref 0 in
(* Pour chaque seq_i du codage de Hamming *)
List.iteri (
fun i (seq_i, _) -> (
if est_issue_de seq_i seq
then begin
bon_indice := i;
incr nb_bonne_seqi;
end;
)
) code;
(* Vérifie qu'une seule séquence du codage soit valide *)
assert (!nb_bonne_seqi = 1);
(* Associe le symbole de la seule séquence du codage qui soit valide *)
let bonne_seqi = fst (List.nth code !bon_indice) in
quel_symbole code bonne_seqi
;;
On va faire quelques essais, avec le codage de Hamming suivant, défini plus haut :
codage_ex1;;
On va vérifier que pour chacun des 4 séquences, elles sont bien décodées si aucune ou si exactement une case a été changée, mais que le décodage échoue si plus de deux changements ont eu lieu :
suite1;;
decodage_une_sequence codage_ex1 suite1;;
suite1_delta0;;
decodage_une_sequence codage_ex1 suite1_delta0;;
suite1_delta5;;
decodage_une_sequence codage_ex1 suite1_delta5;;
Jusqu'ici tout va bien, et sur un exemple avec quatre modifications, la séquence a été trop modifiée pour être encore identifiée comme "A"
:
suite1_4delta;;
decodage_une_sequence codage_ex1 suite1_4delta;; (* va trouver "C" *)
suite2;;
decodage_une_sequence codage_ex1 suite2;;
let suite2_delta6 = [|1; 1; 1; 1; 1; 1; 0|];;
decodage_une_sequence codage_ex1 suite2_delta6;;
suite3;;
decodage_une_sequence codage_ex1 suite3;;
let suite3_delta3 = [|0; 1; 0; 0; 0; 1; 0|];;
decodage_une_sequence codage_ex1 suite3_delta3;;
suite4;;
decodage_une_sequence codage_ex1 suite4;;
let suite4_delta1 = [|1; 1; 1; 0; 1; 0; 1|];;
decodage_une_sequence codage_ex1 suite4_delta1;;
Tout ça semble bien marcher !
On va rapidement réussir à décoder le message bruité donné en exemple dans le texte.
Cette deuxième étape ne va pas être très compliquée, il s'agit essentiellement d'appliquer l'algorithme précédent à chaque sous-séquence de la séquence donnée.
Ces sous-séquences sont faciles à extraire depuis la séquence entière, puisque le texte supposait (implicitement) que toutes les séquences d'un codage de Hamming ont la même taille !
n
($n \geq 1$) des séquences du codage de Hamming,n
,decodage_une_sequence
précédente,let taille_sequences_codage (code : codage_hamming) =
let tailles = List.map (fun (seq, _) -> Array.length seq) code in
let taille = List.hd tailles in
(* On vérifie que toutes les séquence du codage aient cette même taille ! *)
assert (List.for_all (( = ) taille) tailles);
taille
;;
let n1 = taille_sequences_codage codage_ex1 ;;
Ça marche comme voulu !
On commence par définir l'exemple d'une séquence longue de 4 sous-séquences de tailles $n = 7$, venant de la page 5.
let seq_ex1 : suite_caracteres = [|
1;1;0;1;0;1;0;
1;0;1;1;1;0;1;
1;0;0;0;0;0;0;
0;1;1;1;1;1;1
|];;
On va être malin, et découper en utilisant une combinaison des deux fonctions Array.init
et Array.sub
.
Note : Le second argument de
Array.sub
est la longueur, pas l'indice de fin.
Array.sub;;
Array.init;;
Astuce : Si vous êtes en galère le jour de l'oral, rappelez vous qu'il existe deux modules
ListLabels
etArrayLabels
dans la bibliothèque standard, qui sont commeList
etArray
, sauf que les signatures de chaque fonction contiennent des arguments nommés :
ArrayLabels.sub;;
ArrayLabels.init;;
Array.sub tab i n
revient à extraire tab[i],...,tab[i+n-1]
.
Par exemple, la deuxième sous-séquence de taille n = 7
du tableau défini ci-dessus est extraite comme ça :
Array.sub seq_ex1 ((2 - 1) * 7) 7;;
ArrayLabels.sub seq_ex1 ~pos:((2 - 1) * 7) ~len:7;;
C'est ensuite assez facile. On rajoute un test pour être sûr de ne pas rater des caractères.
let decoupe_sequence (seq : suite_caracteres) (n : int) : suite_caracteres list =
let len = Array.length seq in
let k = len / n in
assert (len = (k * n)); (* Test, bonus *)
Array.to_list (
Array.init k (fun i ->
Array.sub seq (i * n) n
)
)
;;
decoupe_sequence seq_ex1 n1;;
Ça marche comme voulu.
let decodage_sequences (code : codage_hamming) (seq : suite_caracteres) : symbole list =
let n = taille_sequences_codage code in
let seqs = decoupe_sequence seq n in
List.map (decodage_une_sequence code) seqs
;;
decodage_sequences codage_ex1 seq_ex1;;
On a bien retrouvé l'exemple de l'énoncé. Et voilà.
Voilà pour les deux questions obligatoires de programmation :
Bien-sûr, ce petit notebook ne se prétend pas être une solution optimale, ni exhaustive.