Exclusion Mutuelle¤

Les exclusions mutuelles constituent un concept fondamental en programmation concurrente et parallèle. L'idée est de garantir que certaines parties du code ne sont pas exécutées simultanément par plusieurs threads, afin d'éviter des conditions de concurrence et des résultats imprévisibles.

Les race conditions ou en français conditions de course sont des situations où le résultat d'une opération dépend de l'ordre d'exécution des threads, ce qui peut conduire à des résultats incorrects ou incohérents. Les exclusions mutuelles permettent de protéger les sections critiques du code pour éviter ces problèmes.

En C++, les exclusions mutuelles sont souvent mises en œuvre à l'aide de verrous (locks) fournis par la bibliothèque standard. Ces verrous sont des objets qui peuvent être verrouillés (locked) par un thread pour empêcher d'autres threads d'accéder à une section critique, puis déverrouillés (unlocked) pour permettre à d'autres threads d'accéder à cette section.

En pratique, les verrous servent notamment à :

protéger les données partagées entre plusieurs threads ;
protéger les ressources partagées entre plusieurs threads (fichiers, sockets, etc.) ;
synchroniser l'accès à des sections critiques du code ;
synchroniser la communication entre threads ;
coordonner la terminaison de threads ;
etc.

Histoire¤

Le concept d'exclusion mutuelle a été introduit par Edsger Dijkstra en 1965. Il a inventé le terme « exclusion mutuelle » pour décrire une propriété souhaitable des systèmes informatiques, à savoir que deux processus ne peuvent pas être simultanément dans une section critique. Dijkstra a également inventé l'algorithme du « banquier » pour éviter les interblocages dans les systèmes informatiques.

Dans son article « Solution of a Problem in Concurrent Programming Control » (https://www.cs.utexas.edu/users/EWD/ewd01xx/EWD123.PDF), Dijkstra introduit le concept de sémaphores, des variables entières utilisées pour la synchronisation entre processus ou threads. Les sémaphores peuvent servir à implémenter l'exclusion mutuelle, ainsi que d'autres formes de synchronisation.

Dekker a introduit un autre algorithme pour l'exclusion mutuelle entre deux processus en 1968. Cet algorithme est similaire à l'algorithme de Peterson, mais utilise des variables supplémentaires pour éviter les problèmes de synchronisation.

Peterson a introduit un algorithme pour l'exclusion mutuelle entre deux processus en 1981. Cet algorithme est souvent utilisé pour illustrer les concepts d'exclusion mutuelle et de synchronisation dans les cours d'informatique.

À cette époque, les processeurs multi-cœurs n'existaient pas et les systèmes informatiques étaient généralement monoprocesseurs. Les problèmes de synchronisation et d'exclusion mutuelle étaient donc moins complexes que dans les systèmes modernes. Un processeur contemporain dispose de plusieurs cœurs et chaque cœur peut exécuter plusieurs threads simultanément. Les enjeux de synchronisation et d'exclusion mutuelle sont par conséquent bien plus délicats aujourd'hui.

Exemple du compteur partagé¤

Considérons un exemple simple où deux threads partagent un compteur. Chaque thread incrémente le compteur un million de fois. Si les threads ne sont pas synchronisés, le résultat final dépendra de l'ordre d'exécution.

En effet, si les deux threads tentent d'incrémenter le compteur simultanément, le résultat final sera imprévisible car l'exécution des instructions n'est pas atomique. Le processeur décompose l'opération d'incrémentation en plusieurs étapes :

Charger la valeur actuelle du compteur depuis la mémoire dans un registre
incrémenter la valeur dans le registre ;
écrire la nouvelle valeur du registre dans la mémoire.

Si un autre thread modifie la valeur du compteur entre ces étapes, le résultat final sera incorrect.

Pour éviter cela, nous devons synchroniser l'accès au compteur afin que les threads ne puissent pas l'incrémenter simultanément. La partie d'incrémentation constitue la section critique.

// counter.cpp
#include <iostream>
#include <thread>
#include <vector>

size_t counter = 0;

class Worker {
public:
    Worker(size_t max_iterations = 1000000) : max_iterations(max_iterations) {}
    const size_t max_iterations;
    void operator() () {
        for (size_t i = 0; i < max_iterations; ++i)
        { // section critique
            ++counter;
        }
    }
};

int main() {
    const int num_threads = std::thread::hardware_concurrency();

    std::vector<std::jthread> threads;
    Worker worker;
    for (int i = 0; i < num_threads; ++i)
        threads.emplace_back(std::jthread(worker));

    for (auto& t : threads) t.join();

    std::cout << "Number of threads: " << num_threads << std::endl;
    std::cout << "Expected Counter: " << worker.max_iterations * num_threads << std::endl;
    std::cout << "Actual Counter: " << counter << std::endl;
}

Verrous Mutex¤

En C++, les verrous sont généralement implémentés à l'aide de la classe std::mutex de la bibliothèque standard. Un objet de type std::mutex se verrouille via la méthode lock() et se déverrouille via unlock().

Exemple simple¤

#include <iostream>
#include <thread>

static int x = 0;

int a() { for(;;) { x = 5; std::cout << x; } }
int b() { for(;;) x = 7; }

int main() {
    std::thread ta(a);
    std::thread tb(b);
    ta.join();
    tb.join();
}

$ g++ sync.cpp
$ timeout 10s ./a.out
$ grep -o 7 data | wc -l
$ wc -c < data

On observe qu'il y a environ une chance sur 10 000 d'afficher un 7.

Autre Exemple¤

Dans cet exemple, deux threads a et b partagent une variable globale x. Le thread a affecte la valeur 5 à x et l'affiche, tandis que le thread b affecte la valeur 7. Les threads s'exécutent indépendamment et peuvent modifier x simultanément, ce qui conduit à des résultats imprévisibles.

#include <iostream>
#include <thread>

static int x = 0;

int a() { for(;;) { x = 5; std::cout << x; } }
int b() { for(;;) x = 7; }

int main() {
    std::thread ta(a);
    std::thread tb(b);
    ta.join();
    tb.join();
}

Exercice : testez quelle est la probabilité d'obtenir un 7 dans la sortie.

Pour cela, exécutez le programme en redirigeant la sortie standard vers un fichier, puis comptez le nombre de 7 dans ce fichier. Faites tourner le programme pendant cinq secondes avec la commande timeout.

Attention, le fichier peut être très volumineux. La commande grep pour compter les 7 peut être utilisée comme suit :

$ timeout 5s ./a.out > data
$ grep -o 5 data | wc -l
$ grep -o 7 data | wc -l