From 528d994ea8d47c16d4298787e0f620d8111d9a83 Mon Sep 17 00:00:00 2001
From: jerem <j.guillot_ext@maxicoffee.com>
Date: Sat, 13 Jun 2026 13:32:38 +0200
Subject: [PATCH] Initial commit

---
 .gitignore        |   4 +
 README.md         |  26 ++++
 app.py            | 141 ++++++++++++++++++++++
 departements.py   |  57 +++++++++
 extractor.py      | 198 ++++++++++++++++++++++++++++++
 requirements.txt  |   2 +
 run.sh            |  20 ++++
 scraper.py        | 255 +++++++++++++++++++++++++++++++++++++++
 static/index.html | 300 ++++++++++++++++++++++++++++++++++++++++++++++
 9 files changed, 1003 insertions(+)
 create mode 100644 .gitignore
 create mode 100644 README.md
 create mode 100644 app.py
 create mode 100644 departements.py
 create mode 100644 extractor.py
 create mode 100644 requirements.txt
 create mode 100755 run.sh
 create mode 100644 scraper.py
 create mode 100644 static/index.html

diff --git a/.gitignore b/.gitignore
new file mode 100644
index 0000000..39cda27
--- /dev/null
+++ b/.gitignore
@@ -0,0 +1,4 @@
+.venv/
+fb_profile/
+prospects.csv
+__pycache__/
diff --git a/README.md b/README.md
new file mode 100644
index 0000000..2ad9caf
--- /dev/null
+++ b/README.md
@@ -0,0 +1,26 @@
+# AutoMood — Prospection de lieux de concert
+
+Petit outil local pour constituer un fichier CSV de prospects (bars, restaurants, campings…) à partir de liens de pages Facebook.
+
+## Lancement
+
+```bash
+./run.sh
+```
+
+La première fois, l'installation prend quelques minutes. Ensuite le serveur démarre et l'interface s'ouvre dans votre navigateur sur http://127.0.0.1:5000. Arrêt : `Ctrl-C` dans le terminal.
+
+## Utilisation
+
+1. **Une seule fois** : cliquez sur **🔑 Connexion Facebook**. Une fenêtre Chromium s'ouvre sur la page de connexion : connectez-vous tranquillement (vous avez 5 minutes, 2FA compris), la fenêtre se ferme toute seule et la session est mémorisée (dossier `fb_profile/`).
+2. Collez le lien Facebook d'un lieu et cliquez sur **Analyser** : une fenêtre Chromium s'ouvre quelques secondes et visite la page « À propos » du lieu.
+3. Vérifiez/corrigez les champs pré-remplis, puis **Ajouter au fichier**.
+4. Dans le tableau, cliquez sur une cellule pour la modifier (utile pour « Date de contact » et « Nom de contact » plus tard).
+
+Les données sont dans `prospects.csv` (UTF-8, séparateur point-virgule) : il s'ouvre directement dans Excel ou Numbers par double-clic.
+
+## À savoir
+
+- ⚠️ N'éditez pas `prospects.csv` dans Excel pendant que l'app tourne : toute modification via l'interface réécrit le fichier et écraserait vos changements Excel. Ouvrez-le en lecture seulement, ou éditez via l'interface.
+- Les champs introuvables sur la page Facebook restent vides : complétez-les à la main dans le formulaire.
+- Si Facebook affiche une vérification de sécurité, résolvez-la dans la fenêtre Chromium puis relancez l'analyse.
diff --git a/app.py b/app.py
new file mode 100644
index 0000000..8b39a19
--- /dev/null
+++ b/app.py
@@ -0,0 +1,141 @@
+"""Serveur local AutoMood : interface web + API + stockage CSV."""
+
+import csv
+import os
+import threading
+import webbrowser
+from datetime import date
+from pathlib import Path
+
+from flask import Flask, jsonify, request, send_file
+
+import extractor
+import scraper
+
+DOSSIER = Path(__file__).parent
+CSV_PATH = DOSSIER / "prospects.csv"
+COLONNES = [
+    "Nom du prospect", "Département", "Ville", "Code Postal", "Adresse",
+    "Date d'ajout", "Date de contact", "Nom de contact",
+    "Téléphone", "Email", "Infos du lieu", "Type", "Lien Facebook",
+]
+
+app = Flask(__name__, static_folder="static")
+verrou_scrape = threading.Lock()
+verrou_csv = threading.Lock()
+
+
+def lire_prospects():
+    if not CSV_PATH.exists():
+        ecrire_prospects([])
+        return []
+    with open(CSV_PATH, encoding="utf-8-sig", newline="") as f:
+        lecteur = csv.DictReader(f, delimiter=";")
+        return [{col: (ligne.get(col) or "") for col in COLONNES} for ligne in lecteur]
+
+
+def ecrire_prospects(lignes):
+    tmp = CSV_PATH.with_suffix(".csv.tmp")
+    with open(tmp, "w", encoding="utf-8-sig", newline="") as f:
+        ecrivain = csv.DictWriter(f, fieldnames=COLONNES, delimiter=";", extrasaction="ignore")
+        ecrivain.writeheader()
+        ecrivain.writerows(lignes)
+    os.replace(tmp, CSV_PATH)
+
+
+@app.get("/")
+def accueil():
+    return app.send_static_file("index.html")
+
+
+@app.post("/api/login")
+def api_login():
+    if not verrou_scrape.acquire(blocking=False):
+        return jsonify({"error": "occupe", "message": "Une autre opération est en cours, patientez."}), 429
+    try:
+        if scraper.connexion():
+            return jsonify({"ok": True, "message": "Connexion Facebook enregistrée."})
+        return jsonify({
+            "error": "login_timeout",
+            "message": "Connexion non détectée dans le temps imparti. Réessayez.",
+        }), 408
+    except Exception as e:
+        return jsonify({"error": "erreur", "message": f"Échec de la connexion : {e}"}), 500
+    finally:
+        verrou_scrape.release()
+
+
+@app.post("/api/scrape")
+def api_scrape():
+    url = (request.get_json(silent=True) or {}).get("url", "").strip()
+    if not url:
+        return jsonify({"error": "url_manquante", "message": "Collez un lien Facebook."}), 400
+    if not verrou_scrape.acquire(blocking=False):
+        return jsonify({"error": "occupe", "message": "Une analyse est déjà en cours, patientez."}), 429
+    try:
+        resultat = scraper.scrape(url)
+        champs = extractor.extraire(resultat["titre"], resultat["texte"], resultat["url"])
+        return jsonify(champs)
+    except scraper.ErreurScrape as e:
+        statuts = {"login_required": 409, "page_introuvable": 404, "url_invalide": 400, "redirection": 422}
+        return jsonify({"error": e.code, "message": str(e)}), statuts.get(e.code, 500)
+    except Exception as e:
+        return jsonify({"error": "erreur", "message": f"Échec de l'analyse : {e}"}), 500
+    finally:
+        verrou_scrape.release()
+
+
+@app.get("/api/prospects")
+def api_lister():
+    lignes = lire_prospects()
+    return jsonify([{"index": i, **ligne} for i, ligne in enumerate(lignes)])
+
+
+@app.post("/api/prospects")
+def api_ajouter():
+    donnees = request.get_json(silent=True) or {}
+    ligne = {col: str(donnees.get(col, "")).strip() for col in COLONNES}
+    if not ligne["Date d'ajout"]:
+        ligne["Date d'ajout"] = date.today().strftime("%d/%m/%Y")
+    with verrou_csv:
+        lignes = lire_prospects()
+        lignes.append(ligne)
+        ecrire_prospects(lignes)
+    return jsonify({"ok": True, "index": len(lignes) - 1})
+
+
+@app.put("/api/prospects/<int:idx>")
+def api_modifier(idx):
+    donnees = request.get_json(silent=True) or {}
+    with verrou_csv:
+        lignes = lire_prospects()
+        if not 0 <= idx < len(lignes):
+            return jsonify({"error": "introuvable", "message": "Ligne inexistante."}), 404
+        for col in COLONNES:
+            if col in donnees:
+                lignes[idx][col] = str(donnees[col]).strip()
+        ecrire_prospects(lignes)
+    return jsonify({"ok": True})
+
+
+@app.delete("/api/prospects/<int:idx>")
+def api_supprimer(idx):
+    with verrou_csv:
+        lignes = lire_prospects()
+        if not 0 <= idx < len(lignes):
+            return jsonify({"error": "introuvable", "message": "Ligne inexistante."}), 404
+        lignes.pop(idx)
+        ecrire_prospects(lignes)
+    return jsonify({"ok": True})
+
+
+@app.get("/api/export")
+def api_export():
+    lire_prospects()  # crée le fichier si absent
+    return send_file(CSV_PATH, as_attachment=True, download_name="prospects.csv")
+
+
+if __name__ == "__main__":
+    lire_prospects()
+    threading.Timer(1.0, webbrowser.open, args=["http://127.0.0.1:5000"]).start()
+    app.run(host="127.0.0.1", port=5000)
diff --git a/departements.py b/departements.py
new file mode 100644
index 0000000..e90fe43
--- /dev/null
+++ b/departements.py
@@ -0,0 +1,57 @@
+"""Table des départements français et résolution depuis un code postal."""
+
+DEPARTEMENTS = {
+    "01": "Ain", "02": "Aisne", "03": "Allier", "04": "Alpes-de-Haute-Provence",
+    "05": "Hautes-Alpes", "06": "Alpes-Maritimes", "07": "Ardèche", "08": "Ardennes",
+    "09": "Ariège", "10": "Aube", "11": "Aude", "12": "Aveyron",
+    "13": "Bouches-du-Rhône", "14": "Calvados", "15": "Cantal", "16": "Charente",
+    "17": "Charente-Maritime", "18": "Cher", "19": "Corrèze",
+    "2A": "Corse-du-Sud", "2B": "Haute-Corse",
+    "21": "Côte-d'Or", "22": "Côtes-d'Armor", "23": "Creuse", "24": "Dordogne",
+    "25": "Doubs", "26": "Drôme", "27": "Eure", "28": "Eure-et-Loir",
+    "29": "Finistère", "30": "Gard", "31": "Haute-Garonne", "32": "Gers",
+    "33": "Gironde", "34": "Hérault", "35": "Ille-et-Vilaine", "36": "Indre",
+    "37": "Indre-et-Loire", "38": "Isère", "39": "Jura", "40": "Landes",
+    "41": "Loir-et-Cher", "42": "Loire", "43": "Haute-Loire", "44": "Loire-Atlantique",
+    "45": "Loiret", "46": "Lot", "47": "Lot-et-Garonne", "48": "Lozère",
+    "49": "Maine-et-Loire", "50": "Manche", "51": "Marne", "52": "Haute-Marne",
+    "53": "Mayenne", "54": "Meurthe-et-Moselle", "55": "Meuse", "56": "Morbihan",
+    "57": "Moselle", "58": "Nièvre", "59": "Nord", "60": "Oise",
+    "61": "Orne", "62": "Pas-de-Calais", "63": "Puy-de-Dôme",
+    "64": "Pyrénées-Atlantiques", "65": "Hautes-Pyrénées", "66": "Pyrénées-Orientales",
+    "67": "Bas-Rhin", "68": "Haut-Rhin", "69": "Rhône", "70": "Haute-Saône",
+    "71": "Saône-et-Loire", "72": "Sarthe", "73": "Savoie", "74": "Haute-Savoie",
+    "75": "Paris", "76": "Seine-Maritime", "77": "Seine-et-Marne", "78": "Yvelines",
+    "79": "Deux-Sèvres", "80": "Somme", "81": "Tarn", "82": "Tarn-et-Garonne",
+    "83": "Var", "84": "Vaucluse", "85": "Vendée", "86": "Vienne",
+    "87": "Haute-Vienne", "88": "Vosges", "89": "Yonne", "90": "Territoire de Belfort",
+    "91": "Essonne", "92": "Hauts-de-Seine", "93": "Seine-Saint-Denis",
+    "94": "Val-de-Marne", "95": "Val-d'Oise",
+    "971": "Guadeloupe", "972": "Martinique", "973": "Guyane",
+    "974": "La Réunion", "976": "Mayotte",
+}
+
+
+def departement_depuis_cp(cp):
+    """Retourne « NN - Nom » depuis un code postal à 5 chiffres, ou ""."""
+    cp = (cp or "").strip()
+    if len(cp) != 5 or not cp.isdigit():
+        return ""
+    if cp.startswith("97"):
+        cle = cp[:3]
+    elif cp.startswith("20"):
+        # Corse : 20000-20199 → Corse-du-Sud, 20200-20699 → Haute-Corse (approximation usuelle)
+        cle = "2A" if int(cp) < 20200 else "2B"
+    else:
+        cle = cp[:2]
+    nom = DEPARTEMENTS.get(cle)
+    return f"{cle} - {nom}" if nom else ""
+
+
+if __name__ == "__main__":
+    for cp, attendu in [("29200", "29 - Finistère"), ("20090", "2A - Corse-du-Sud"),
+                        ("20600", "2B - Haute-Corse"), ("97400", "974 - La Réunion"),
+                        ("75011", "75 - Paris"), ("00000", ""), ("abc", "")]:
+        resultat = departement_depuis_cp(cp)
+        statut = "OK" if resultat == attendu else f"ECHEC (attendu {attendu!r})"
+        print(f"{cp} -> {resultat!r} {statut}")
diff --git a/extractor.py b/extractor.py
new file mode 100644
index 0000000..bed9271
--- /dev/null
+++ b/extractor.py
@@ -0,0 +1,198 @@
+"""Extraction par règles : texte brut d'une page Facebook → champs du prospect."""
+
+import re
+import unicodedata
+from datetime import date
+
+from departements import DEPARTEMENTS, departement_depuis_cp
+
+RE_TELEPHONE = re.compile(r"(?:\+33\s?[1-9]|0[1-9])(?:[\s.\-]?\d{2}){4}")
+RE_EMAIL = re.compile(r"[A-Za-z0-9._%+\-]+@[A-Za-z0-9.\-]+\.[A-Za-z]{2,}")
+RE_CP_VILLE = re.compile(r"(?<!\d)(\d{5})(?!\d)[ \t,]+([A-Za-zÀ-ÖØ-öø-ÿ'\- ]{2,40})")
+RE_CP_SEUL = re.compile(r"(?<!\d)(\d{5})(?!\d)")
+# « à Saint-Omer-de-Blain (44) » : ville + numéro de département entre parenthèses
+RE_VILLE_DEPT = re.compile(r"([A-Za-zÀ-ÖØ-öø-ÿ'’\-]{3,40})?\s*\(\s*(\d{2,3}|2[AB])\s*\)", re.I)
+# « Blain, France, 44130 » ou « Blain, 44130 » : ville avant le code postal
+RE_VILLE_CP = re.compile(
+    r"([A-Za-zÀ-ÖØ-öø-ÿ'’\- ]{2,40})\s*,\s*(?:France\s*,?\s*)?(\d{5})(?!\d)", re.I)
+
+VOIES = (r"rue|avenue|av\.|boulevard|bd\.?|chemin|route|impasse|place|quai|allée|cours"
+         r"|esplanade|promenade|lieu-dit|hameau|zone|za|zac|zi")
+# Ligne ressemblant à une voie : « 12 Quai du Port », « 6, rue du moulin »...
+RE_ADRESSE = re.compile(
+    rf"(?:^|\n)\s*((?:\d{{1,4}}\s?(?:bis|ter)?\s*,?\s+)?(?:{VOIES})\s[^\n;]{{2,60}})", re.I)
+
+# Mots d'interface Facebook à ne pas prendre pour une ville devant « (NN) »
+MOTS_INTERFACE = {
+    "photos", "avis", "reels", "followers", "publications", "posts",
+    "mentions", "tout", "plus", "voir", "vidéos", "amis",
+}
+
+# (mot-clé, type) — ordre = priorité, le premier trouvé gagne
+TYPES = [
+    ("camping", "Camping"),
+    ("guinguette", "Guinguette"),
+    ("festival", "Festival"),
+    ("restaurant", "Restaurant"),
+    ("pizzeria", "Restaurant"),
+    ("creperie", "Restaurant"),
+    ("brasserie", "Restaurant"),
+    ("bistrot", "Restaurant"),
+    ("bistro", "Restaurant"),
+    ("pub", "Bar"),
+    ("bar", "Bar"),
+    ("cafe", "Bar"),
+    ("cave", "Bar"),
+    ("salle", "Salle"),
+    ("mjc", "Salle"),
+    ("hotel", "Hôtel"),
+    ("domaine", "Domaine"),
+]
+
+INFOS_LIEU = [
+    "jardin", "terrasse", "plage", "bord de mer", "port", "piscine",
+    "lac", "riviere", "rooftop", "patio", "plein air", "scene", "guinguette",
+]
+
+
+def _sans_accents(texte):
+    return unicodedata.normalize("NFKD", texte).encode("ascii", "ignore").decode()
+
+
+def _chercher_mot(mot, texte_normalise):
+    return re.search(rf"(?<![a-z]){re.escape(mot)}(?![a-z])", texte_normalise) is not None
+
+
+def _telephone(texte):
+    m = RE_TELEPHONE.search(texte)
+    if not m:
+        return ""
+    chiffres = re.sub(r"\D", "", m.group(0))
+    if chiffres.startswith("33"):
+        chiffres = "0" + chiffres[2:]
+    if len(chiffres) != 10:
+        return ""
+    return " ".join(chiffres[i:i + 2] for i in range(0, 10, 2))
+
+
+def _email(texte):
+    for m in RE_EMAIL.finditer(texte):
+        adresse = m.group(0)
+        if not adresse.lower().endswith(("@facebook.com", "@fb.com")):
+            return adresse
+    return ""
+
+
+def _cp_ville(texte):
+    for m in RE_CP_VILLE.finditer(texte):
+        cp, ville = m.group(1), m.group(2)
+        if not ("01" <= cp[:2] <= "98"):
+            continue
+        ville = ville.split("\n")[0].strip(" -'")
+        ville = re.sub(r"\bfrance\b", "", ville, flags=re.IGNORECASE).strip(" ,-")
+        return cp, ville.title()
+    # « Blain, France, 44130 » : ville avant le code postal
+    for m in RE_VILLE_CP.finditer(texte):
+        cp, ville = m.group(2), m.group(1).split("\n")[-1].strip(" -'’")
+        if not ("01" <= cp[:2] <= "98") or ville.lower() == "france":
+            continue
+        return cp, ville.title() if ville.islower() else ville
+    m = RE_CP_SEUL.search(texte)
+    if m and "01" <= m.group(1)[:2] <= "98":
+        return m.group(1), ""
+    return "", ""
+
+
+def _nettoyer_adresse(brut):
+    # couper avant le code postal s'il suit sur la même ligne
+    brut = re.split(r",?\s*\d{5}\b", brut)[0]
+    # « 6, rue du moulin , Blain, France » : ne garder que jusqu'au segment de voie,
+    # la ville et le pays ont leurs propres colonnes
+    segments = [s.strip() for s in brut.split(",") if s.strip()]
+    dernier_voie = -1
+    for i, seg in enumerate(segments):
+        if re.search(rf"\b(?:{VOIES})\b", seg, re.I):
+            dernier_voie = i
+    if dernier_voie >= 0:
+        segments = segments[:dernier_voie + 1]
+    else:
+        segments = [s for s in segments if s.lower() != "france"]
+    return ", ".join(segments).strip(" ,-–")
+
+
+def _adresse(texte):
+    lignes = [l.strip() for l in texte.split("\n")]
+    # libellé « Adresse » de la section Coordonnées (mais pas « Adresse e-mail »)
+    for i, ligne in enumerate(lignes):
+        if ligne.lower() in ("adresse", "address"):
+            for suite in lignes[i + 1:i + 3]:
+                if suite and not re.match(r"^(adresse|address|e-?mail|téléphone|phone|site|web|messenger)", suite, re.I):
+                    return _nettoyer_adresse(suite)
+    m = RE_ADRESSE.search(texte)
+    return _nettoyer_adresse(m.group(1)) if m else ""
+
+
+def _ville_dept_parentheses(texte):
+    """Repli quand il n'y a pas d'adresse postale : « Saint-Omer-de-Blain (44) »."""
+    for m in RE_VILLE_DEPT.finditer(texte):
+        cle = m.group(2).upper()
+        nom = DEPARTEMENTS.get(cle)
+        if not nom:
+            continue
+        ville = (m.group(1) or "").strip("-'’ ")
+        if len(ville) < 3 or ville.lower() in MOTS_INTERFACE or ville.lower() == "france":
+            ville = ""
+        return ville, f"{cle} - {nom}"
+    return "", ""
+
+
+def _type_lieu(titre, texte):
+    # La catégorie de la page apparaît en général dans les premiers caractères du texte
+    for zone in (titre, texte[:500], texte):
+        zone_norm = _sans_accents(zone.lower())
+        for mot, type_lieu in TYPES:
+            if _chercher_mot(mot, zone_norm):
+                return type_lieu
+    return ""
+
+
+def _infos_lieu(texte):
+    texte_norm = _sans_accents(texte.lower())
+    trouves = [mot for mot in INFOS_LIEU if _chercher_mot(mot, texte_norm)]
+    return ", ".join(trouves[:5])
+
+
+def extraire(titre, texte, url):
+    cp, ville = _cp_ville(texte)
+    departement = departement_depuis_cp(cp)
+    if not cp:
+        ville_repli, departement = _ville_dept_parentheses(texte)
+        ville = ville or ville_repli
+    return {
+        "Nom du prospect": titre.strip(),
+        "Département": departement,
+        "Ville": ville,
+        "Code Postal": cp,
+        "Adresse": _adresse(texte),
+        "Date d'ajout": date.today().strftime("%d/%m/%Y"),
+        "Date de contact": "",
+        "Nom de contact": "",
+        "Téléphone": _telephone(texte),
+        "Email": _email(texte),
+        "Infos du lieu": _infos_lieu(texte),
+        "Type": _type_lieu(titre, texte),
+        "Lien Facebook": url,
+    }
+
+
+if __name__ == "__main__":
+    exemple = """Le Vieux Gréement
+    Bar · Restaurant
+    12 Quai du Port, 29200 Brest, France
+    06 12 34 56 78
+    contact@vieuxgreement.fr
+    Grande terrasse avec vue sur le port, concerts en plein air l'été dans le jardin.
+    """
+    import json
+    champs = extraire("Le Vieux Gréement", exemple, "https://www.facebook.com/vieuxgreement")
+    print(json.dumps(champs, ensure_ascii=False, indent=2))
diff --git a/requirements.txt b/requirements.txt
new file mode 100644
index 0000000..cc714db
--- /dev/null
+++ b/requirements.txt
@@ -0,0 +1,2 @@
+flask>=3.0
+playwright>=1.45
diff --git a/run.sh b/run.sh
new file mode 100755
index 0000000..13e0173
--- /dev/null
+++ b/run.sh
@@ -0,0 +1,20 @@
+#!/bin/bash
+set -e
+cd "$(dirname "$0")"
+
+# Python Homebrew en priorité (le python système 3.9 est trop vieux pour Playwright récent)
+if [ -x /opt/homebrew/bin/python3 ]; then
+  PY=/opt/homebrew/bin/python3
+else
+  PY=$(command -v python3)
+fi
+
+if [ ! -d .venv ]; then
+  echo "Première installation (environnement Python + Chromium), patientez quelques minutes..."
+  "$PY" -m venv .venv
+  .venv/bin/pip install --upgrade pip
+  .venv/bin/pip install -r requirements.txt
+  .venv/bin/playwright install chromium
+fi
+
+exec .venv/bin/python app.py
diff --git a/scraper.py b/scraper.py
new file mode 100644
index 0000000..2e9e18b
--- /dev/null
+++ b/scraper.py
@@ -0,0 +1,255 @@
+"""Scraping des pages « À propos » Facebook avec une session Chromium persistante."""
+
+import re
+import sys
+import time
+from pathlib import Path
+from urllib.parse import urlparse, parse_qs
+
+from playwright.sync_api import sync_playwright
+
+PROFIL = str(Path(__file__).parent / "fb_profile")
+ATTENTE_LOGIN_S = 300
+
+
+class ErreurScrape(Exception):
+    def __init__(self, code, message):
+        super().__init__(message)
+        self.code = code
+
+
+# Liens de partage/contenu qui ne désignent pas directement une page : à résoudre en les visitant
+SLUGS_A_RESOUDRE = {"share", "reel", "reels", "story.php", "photo", "photo.php", "video.php", "watch", "posts", "l.php"}
+
+
+def _urls_pour_id(page_id):
+    # marqueur = les chiffres seuls : Facebook réécrit souvent profile.php?id=N
+    # en /people/Nom-De-Page/N/, où « id= » disparaît mais pas le numéro
+    canonique = f"https://www.facebook.com/profile.php?id={page_id}"
+    return {"canonique": canonique, "about": f"{canonique}&sk=about", "marqueur": str(page_id)}
+
+
+def normaliser_url(url):
+    """Retourne {canonique, abouts, marqueur} ou {resoudre: url} ; lève ErreurScrape sinon.
+
+    « marqueur » est un fragment qui doit rester présent dans l'URL après navigation :
+    il sert à détecter les redirections de Facebook (vers le fil, votre profil...).
+    """
+    url = url.strip()
+    if not url.startswith("http"):
+        url = "https://" + url
+    p = urlparse(url)
+    if not re.search(r"(?:^|\.)(facebook|fb)\.com$", p.netloc.lower().split(":")[0]):
+        raise ErreurScrape("url_invalide", "Ce n'est pas un lien Facebook.")
+
+    segments = [s for s in p.path.split("/") if s]
+
+    if segments and segments[0] == "profile.php" or p.path.rstrip("/").endswith("profile.php"):
+        page_id = parse_qs(p.query).get("id", [""])[0]
+        if not page_id:
+            raise ErreurScrape("url_invalide", "Lien profile.php sans identifiant.")
+        return _urls_pour_id(page_id)
+
+    if not segments:
+        raise ErreurScrape("url_invalide", "Lien Facebook sans nom de page.")
+
+    premier = segments[0].lower()
+
+    if premier in SLUGS_A_RESOUDRE:
+        return {"resoudre": url}
+
+    # facebook.com/p/Nom-De-Page-100063123456789 (nouvelles pages)
+    if premier == "p" and len(segments) >= 2:
+        m = re.search(r"(\d{5,})/?$", segments[1])
+        if m:
+            return _urls_pour_id(m.group(1))
+        raise ErreurScrape("url_invalide", "Lien /p/ sans identifiant numérique reconnaissable.")
+
+    # facebook.com/people/Nom/123456789 et facebook.com/pages/Nom/123456789 (anciens formats)
+    if premier in ("people", "pages"):
+        for seg in reversed(segments):
+            if re.fullmatch(r"\d{5,}", seg):
+                return _urls_pour_id(seg)
+        raise ErreurScrape("url_invalide", f"Lien /{premier}/ sans identifiant numérique.")
+
+    slug = segments[0]
+    canonique = f"https://www.facebook.com/{slug}"
+    return {"canonique": canonique, "about": f"{canonique}/about", "marqueur": slug.lower()}
+
+
+def _sur_la_bonne_page(page, marqueur):
+    return marqueur in page.url.lower()
+
+
+def _refuser_cookies(page):
+    try:
+        bouton = page.get_by_role(
+            "button",
+            name=re.compile(r"refuser les cookies optionnels|decline optional cookies|autoriser tous les cookies", re.I),
+        ).first
+        bouton.click(timeout=3000)
+        page.wait_for_timeout(1000)
+    except Exception:
+        pass
+
+
+def _mur_de_connexion(page):
+    if "/login" in page.url:
+        return True
+    try:
+        corps = page.inner_text("body", timeout=5000)
+    except Exception:
+        return False
+    return bool(re.search(r"connectez-vous pour continuer|log into facebook|vous devez vous connecter", corps, re.I))
+
+
+def _est_connecte(contexte):
+    """Le cookie de session « c_user » n'existe que si un compte est connecté."""
+    try:
+        return any(c["name"] == "c_user" for c in contexte.cookies("https://www.facebook.com"))
+    except Exception:
+        return False
+
+
+def connexion():
+    """Ouvre Facebook dans la fenêtre persistante et attend que l'utilisateur se connecte.
+
+    Aucune autre action ne tourne pendant ce temps : l'utilisateur a jusqu'à
+    ATTENTE_LOGIN_S secondes pour se connecter tranquillement (captcha, 2FA...).
+    Retourne True si la session est établie.
+    """
+    with sync_playwright() as pw:
+        contexte = pw.chromium.launch_persistent_context(
+            user_data_dir=PROFIL, headless=False, locale="fr-FR",
+            viewport={"width": 1280, "height": 900},
+        )
+        try:
+            if _est_connecte(contexte):
+                return True
+            page = contexte.pages[0] if contexte.pages else contexte.new_page()
+            page.goto("https://www.facebook.com/login", wait_until="domcontentloaded", timeout=30000)
+            page.wait_for_timeout(2000)
+            _refuser_cookies(page)
+            debut = time.time()
+            while time.time() - debut < ATTENTE_LOGIN_S:
+                if _est_connecte(contexte):
+                    page.wait_for_timeout(2000)  # laisser FB finir d'écrire la session
+                    return True
+                page.wait_for_timeout(2000)
+            return False
+        finally:
+            contexte.close()
+
+
+def _texte_page(page):
+    try:
+        return page.locator('div[role="main"]').first.inner_text(timeout=5000)
+    except Exception:
+        try:
+            return page.inner_text("body", timeout=5000)
+        except Exception:
+            return ""
+
+
+def scrape(url):
+    """Visite les pages « À propos » et retourne {"titre", "texte", "url"}."""
+    info = normaliser_url(url)
+    with sync_playwright() as pw:
+        contexte = pw.chromium.launch_persistent_context(
+            user_data_dir=PROFIL, headless=False, locale="fr-FR",
+            viewport={"width": 1280, "height": 900},
+        )
+        try:
+            if not _est_connecte(contexte):
+                raise ErreurScrape(
+                    "login_required",
+                    "Aucune session Facebook : cliquez d'abord sur « Connexion Facebook ».",
+                )
+            page = contexte.pages[0] if contexte.pages else contexte.new_page()
+
+            # Lien de partage (/share/, /reel/...) : le visiter pour découvrir la vraie page
+            if info.get("resoudre"):
+                page.goto(info["resoudre"], wait_until="domcontentloaded", timeout=30000)
+                page.wait_for_timeout(3000)
+                _refuser_cookies(page)
+                info = normaliser_url(page.url)
+                if info.get("resoudre"):
+                    raise ErreurScrape(
+                        "url_invalide",
+                        "Ce lien de partage ne mène pas à une page de lieu : ouvrez la page du lieu "
+                        "dans Facebook et copiez son adresse directe.",
+                    )
+
+            # Page d'accueil du lieu : la carte « Intro » contient souvent l'adresse,
+            # qui n'apparaît dans aucune sous-section « À propos »
+            page.goto(info["canonique"], wait_until="domcontentloaded", timeout=30000)
+            page.wait_for_timeout(2500)
+            _refuser_cookies(page)
+            if _mur_de_connexion(page):
+                raise ErreurScrape(
+                    "login_required",
+                    "Session Facebook expirée : cliquez sur « Connexion Facebook » pour vous reconnecter.",
+                )
+            if not _sur_la_bonne_page(page, info["marqueur"]):
+                # profile.php?id=N est parfois réécrit vers l'adresse « vanity » de la
+                # page : si on a atterri sur un profil/une page plausible, adopter ce slug.
+                nouveau = urlparse(page.url).path.strip("/").split("/")[0].lower()
+                if (info["marqueur"].isdigit() and nouveau
+                        and nouveau not in SLUGS_A_RESOUDRE | {"p", "people", "pages", "profile.php"}):
+                    info["marqueur"] = nouveau
+                else:
+                    # Redirigé ailleurs (fil d'actualité, votre profil...) :
+                    # surtout ne pas extraire ce texte, ce serait VOS infos.
+                    raise ErreurScrape(
+                        "redirection",
+                        f"Facebook a redirigé vers {page.url} au lieu de la page demandée. "
+                        "Ouvrez la page du lieu dans Facebook et copiez son adresse directe.",
+                    )
+            titre = ""
+            for _ in range(6):  # le titre met parfois quelques secondes à refléter la page
+                titre = re.sub(r"\s*[|\-–]\s*(Facebook|À propos|About).*$", "", page.title()).strip()
+                titre = re.sub(r"^\(\d+\+?\)\s*", "", titre)  # compteur de notifications « (20+) »
+                if titre and titre.lower() != "facebook":
+                    break
+                page.wait_for_timeout(500)
+            corps = _texte_page(page)
+            if re.search(r"ce contenu n'est pas disponible|this content isn'?t available|page introuvable", corps, re.I):
+                raise ErreurScrape("page_introuvable", "Cette page Facebook est introuvable ou inaccessible.")
+            if not titre or titre.lower() == "facebook":
+                # repli : la première ligne du contenu est le nom du lieu
+                titre = next((l.strip() for l in corps.split("\n") if l.strip()), "")
+            textes = [corps]
+
+            # Page « À propos »
+            page.goto(info["about"], wait_until="domcontentloaded", timeout=30000)
+            page.wait_for_timeout(2500)
+            if _sur_la_bonne_page(page, info["marqueur"]):
+                textes.append(_texte_page(page))
+
+            # Sous-section « Coordonnées » : on CLIQUE l'élément dans la page plutôt que
+            # de deviner l'URL — l'URL directe n'existe pas pour les nouvelles pages et
+            # Facebook redirige alors vers VOTRE propre profil. Selon le style de page,
+            # c'est un onglet (nouvelles pages) ou un lien (pages classiques).
+            for role in ("tab", "link"):
+                try:
+                    page.locator('div[role="main"]').get_by_role(
+                        role, name=re.compile(r"coordonnées|contact and basic info", re.I)
+                    ).first.click(timeout=4000)
+                    page.wait_for_timeout(2500)
+                    if _sur_la_bonne_page(page, info["marqueur"]):
+                        textes.append(_texte_page(page))
+                    break
+                except Exception:
+                    continue  # pas trouvé sous ce rôle ; sinon on garde le texte À propos
+
+            return {"titre": titre, "texte": "\n".join(textes), "url": info["canonique"]}
+        finally:
+            contexte.close()
+
+
+if __name__ == "__main__":
+    if len(sys.argv) != 2:
+        print("Usage : python scraper.py <url-facebook>")
+        sys.exit(1)
+    resultat = scrape(sys.argv[1])
+    print(f"=== TITRE ===\n{resultat['titre']}\n=== TEXTE ===\n{resultat['texte']}")
diff --git a/static/index.html b/static/index.html
new file mode 100644
index 0000000..212037e
--- /dev/null
+++ b/static/index.html
@@ -0,0 +1,300 @@
+<!DOCTYPE html>
+<html lang="fr">
+<head>
+<meta charset="UTF-8">
+<meta name="viewport" content="width=device-width, initial-scale=1">
+<title>AutoMood — Prospection</title>
+<style>
+  :root { --accent: #5b4dbf; --fond: #f5f4fa; --bordure: #ddd; }
+  * { box-sizing: border-box; }
+  body { font-family: -apple-system, "Segoe UI", sans-serif; margin: 0; background: var(--fond); color: #222; }
+  header { background: var(--accent); color: #fff; padding: 14px 24px; }
+  header h1 { margin: 0; font-size: 20px; }
+  main { max-width: 1200px; margin: 24px auto; padding: 0 16px; }
+  section { background: #fff; border-radius: 10px; padding: 20px; margin-bottom: 24px; box-shadow: 0 1px 4px rgba(0,0,0,.08); }
+  h2 { margin-top: 0; font-size: 16px; }
+  .ligne-url { display: flex; gap: 8px; }
+  .ligne-url input { flex: 1; }
+  input, button { font: inherit; padding: 8px 10px; border-radius: 6px; border: 1px solid var(--bordure); }
+  input:focus { outline: 2px solid var(--accent); border-color: transparent; }
+  button { background: var(--accent); color: #fff; border: none; cursor: pointer; }
+  button:disabled { opacity: .5; cursor: wait; }
+  button.secondaire { background: #eee; color: #222; }
+  button.danger { background: #c0392b; }
+  #message { margin: 10px 0 0; padding: 10px; border-radius: 6px; display: none; }
+  #message.erreur { display: block; background: #fdecea; color: #b03a2e; }
+  #message.info { display: block; background: #eaf2fd; color: #1a5276; }
+  #formulaire { display: none; margin-top: 16px; }
+  .grille { display: grid; grid-template-columns: repeat(auto-fill, minmax(240px, 1fr)); gap: 12px; }
+  .champ label { display: block; font-size: 12px; color: #666; margin-bottom: 3px; }
+  .champ input { width: 100%; }
+  .actions { margin-top: 14px; display: flex; gap: 8px; }
+  .carte { border: 1px solid var(--bordure); border-radius: 8px; margin-bottom: 10px; background: #fff; }
+  .carte-tete { display: flex; flex-wrap: wrap; gap: 6px 14px; align-items: center; padding: 10px 12px; cursor: pointer; }
+  .carte-tete:hover { background: #faf9fd; }
+  .carte-titre { display: flex; align-items: center; gap: 8px; min-width: 260px; flex: 1; }
+  .carte-titre strong { font-size: 14px; }
+  .badge { background: var(--accent); color: #fff; border-radius: 99px; padding: 2px 9px; font-size: 11px; white-space: nowrap; }
+  .carte-infos { display: flex; flex-wrap: wrap; gap: 4px 16px; font-size: 13px; align-items: center; }
+  .sous { color: #666; font-size: 12px; }
+  .carte-boutons { display: flex; gap: 6px; margin-left: auto; }
+  .carte-boutons button { padding: 4px 9px; font-size: 12px; }
+  .carte-detail { padding: 12px; border-top: 1px solid var(--bordure); background: #fbfaff; }
+  .vide { color: #999; font-style: italic; }
+  .barre-liste { display: flex; justify-content: space-between; align-items: center; margin-bottom: 12px; }
+  .spinner { display: inline-block; width: 14px; height: 14px; border: 2px solid #fff; border-top-color: transparent; border-radius: 50%; animation: tourne .8s linear infinite; vertical-align: -2px; margin-right: 6px; }
+  @keyframes tourne { to { transform: rotate(360deg); } }
+</style>
+</head>
+<body>
+<header><h1>🎸 AutoMood — Prospection de lieux de concert</h1></header>
+<main>
+
+<section>
+  <h2>Nouveau prospect</h2>
+  <div class="ligne-url">
+    <input id="url" type="url" placeholder="https://www.facebook.com/nom-du-lieu" autofocus>
+    <button id="analyser">Analyser</button>
+    <button id="connexion" class="secondaire" title="À faire une seule fois : la session est mémorisée">🔑 Connexion Facebook</button>
+  </div>
+  <div id="message"></div>
+  <form id="formulaire">
+    <div class="grille" id="grille-champs"></div>
+    <div class="actions">
+      <button type="submit">Ajouter au fichier</button>
+      <button type="button" class="secondaire" id="annuler">Annuler</button>
+    </div>
+  </form>
+</section>
+
+<section>
+  <div class="barre-liste">
+    <h2 style="margin:0">Liste des prospects <span id="compteur"></span></h2>
+    <a href="/api/export"><button type="button" class="secondaire">Télécharger le CSV</button></a>
+  </div>
+  <input id="recherche" type="search" placeholder="Filtrer par nom, ville, type, département…" style="width:100%;margin-bottom:12px">
+  <div id="liste"></div>
+</section>
+
+</main>
+<script>
+const COLONNES = ["Nom du prospect","Département","Ville","Code Postal","Adresse","Date d'ajout",
+  "Date de contact","Nom de contact","Téléphone","Email","Infos du lieu","Type","Lien Facebook"];
+
+const $ = id => document.getElementById(id);
+
+function message(texte, classe) {
+  const m = $("message");
+  m.textContent = texte;
+  m.className = classe || "";
+}
+
+// --- Formulaire de nouveau prospect ---
+
+function construireFormulaire(valeurs) {
+  const grille = $("grille-champs");
+  grille.innerHTML = "";
+  for (const col of COLONNES) {
+    const div = document.createElement("div");
+    div.className = "champ";
+    const label = document.createElement("label");
+    label.textContent = col;
+    const input = document.createElement("input");
+    input.name = col;
+    input.value = valeurs[col] || "";
+    if (col === "Date de contact") input.placeholder = "à remplir plus tard";
+    div.append(label, input);
+    grille.append(div);
+  }
+  $("formulaire").style.display = "block";
+}
+
+$("connexion").addEventListener("click", async () => {
+  const bouton = $("connexion");
+  bouton.disabled = true;
+  $("analyser").disabled = true;
+  bouton.innerHTML = '<span class="spinner"></span>En attente de votre connexion…';
+  message("Une fenêtre Chromium s'ouvre sur la page de connexion Facebook. Connectez-vous tranquillement (vous avez 5 minutes), la fenêtre se fermera toute seule.", "info");
+  try {
+    const rep = await fetch("/api/login", { method: "POST" });
+    const donnees = await rep.json();
+    message(rep.ok ? "Connexion Facebook enregistrée ✔ Vous pouvez analyser des pages." : (donnees.message || "Échec de la connexion."), rep.ok ? "info" : "erreur");
+  } catch {
+    message("Le serveur ne répond pas. Relancez ./run.sh.", "erreur");
+  } finally {
+    bouton.disabled = false;
+    $("analyser").disabled = false;
+    bouton.textContent = "🔑 Connexion Facebook";
+  }
+});
+
+$("analyser").addEventListener("click", async () => {
+  const url = $("url").value.trim();
+  if (!url) { message("Collez d'abord un lien Facebook.", "erreur"); return; }
+  const bouton = $("analyser");
+  bouton.disabled = true;
+  bouton.innerHTML = '<span class="spinner"></span>Analyse…';
+  message("Analyse en cours, une fenêtre Chromium s'ouvre quelques secondes…", "info");
+  try {
+    const rep = await fetch("/api/scrape", {
+      method: "POST",
+      headers: { "Content-Type": "application/json" },
+      body: JSON.stringify({ url }),
+    });
+    const donnees = await rep.json();
+    if (!rep.ok) { message(donnees.message || "Erreur lors de l'analyse.", "erreur"); return; }
+    message("Champs pré-remplis : vérifiez et corrigez avant d'ajouter.", "info");
+    construireFormulaire(donnees);
+  } catch {
+    message("Le serveur ne répond pas. Relancez ./run.sh.", "erreur");
+  } finally {
+    bouton.disabled = false;
+    bouton.textContent = "Analyser";
+  }
+});
+
+$("formulaire").addEventListener("submit", async (e) => {
+  e.preventDefault();
+  const ligne = {};
+  for (const input of $("grille-champs").querySelectorAll("input")) ligne[input.name] = input.value;
+  const rep = await fetch("/api/prospects", {
+    method: "POST",
+    headers: { "Content-Type": "application/json" },
+    body: JSON.stringify(ligne),
+  });
+  if (rep.ok) {
+    $("formulaire").style.display = "none";
+    $("url").value = "";
+    message("Prospect ajouté ✔", "info");
+    chargerListe();
+  } else {
+    message("Échec de l'ajout.", "erreur");
+  }
+});
+
+$("annuler").addEventListener("click", () => {
+  $("formulaire").style.display = "none";
+  message("", "");
+});
+
+// --- Liste des prospects en fiches ---
+
+let prospects = [];
+
+const echap = (t) => (t || "").replace(/[&<>"]/g, c => ({ "&": "&amp;", "<": "&lt;", ">": "&gt;", '"': "&quot;" }[c]));
+
+async function chargerListe() {
+  prospects = await (await fetch("/api/prospects")).json();
+  afficherListe();
+}
+
+function afficherListe() {
+  const filtre = $("recherche").value.trim().toLowerCase();
+  const visibles = prospects.filter(p =>
+    !filtre || COLONNES.some(c => (p[c] || "").toLowerCase().includes(filtre)));
+  $("compteur").textContent = filtre ? `(${visibles.length}/${prospects.length})` : `(${prospects.length})`;
+  const liste = $("liste");
+  liste.innerHTML = "";
+  if (!visibles.length) {
+    liste.innerHTML = `<p class="vide">${prospects.length ? "Aucun prospect ne correspond au filtre." : "Aucun prospect pour le moment."}</p>`;
+    return;
+  }
+  for (const p of visibles) liste.append(carte(p));
+}
+
+function carte(p) {
+  const div = document.createElement("div");
+  div.className = "carte";
+
+  const tete = document.createElement("div");
+  tete.className = "carte-tete";
+  const lieu = [p["Ville"], p["Département"]].filter(Boolean).join(" · ");
+  const contact = p["Date de contact"]
+    ? `✅ Contacté le ${echap(p["Date de contact"])}${p["Nom de contact"] ? ` (${echap(p["Nom de contact"])})` : ""}`
+    : "⏳ À contacter";
+  tete.innerHTML = `
+    <div class="carte-titre">
+      <strong>${echap(p["Nom du prospect"]) || "<i>Sans nom</i>"}</strong>
+      ${p["Type"] ? `<span class="badge">${echap(p["Type"])}</span>` : ""}
+    </div>
+    <div class="carte-infos">
+      ${lieu ? `<span class="sous">📍 ${echap(lieu)}</span>` : ""}
+      ${p["Téléphone"] ? `<span>📞 ${echap(p["Téléphone"])}</span>` : ""}
+      ${p["Email"] ? `<span>✉️ ${echap(p["Email"])}</span>` : ""}
+      <span class="sous">${contact}</span>
+    </div>`;
+
+  const boutons = document.createElement("div");
+  boutons.className = "carte-boutons";
+  if (p["Lien Facebook"]) {
+    const fb = document.createElement("button");
+    fb.className = "secondaire";
+    fb.textContent = "Facebook ↗";
+    fb.addEventListener("click", (e) => { e.stopPropagation(); window.open(p["Lien Facebook"], "_blank"); });
+    boutons.append(fb);
+  }
+  const suppr = document.createElement("button");
+  suppr.className = "danger";
+  suppr.textContent = "✕";
+  suppr.title = "Supprimer";
+  suppr.addEventListener("click", async (e) => {
+    e.stopPropagation();
+    if (!confirm(`Supprimer « ${p["Nom du prospect"] || "cette ligne"} » ?`)) return;
+    await fetch(`/api/prospects/${p.index}`, { method: "DELETE" });
+    chargerListe();
+  });
+  boutons.append(suppr);
+  tete.append(boutons);
+
+  const detail = document.createElement("div");
+  detail.className = "carte-detail";
+  detail.style.display = "none";
+
+  tete.addEventListener("click", () => {
+    const ouvert = detail.style.display !== "none";
+    if (!ouvert && !detail.hasChildNodes()) construireDetail(detail, p);
+    detail.style.display = ouvert ? "none" : "block";
+  });
+
+  div.append(tete, detail);
+  return div;
+}
+
+function construireDetail(detail, p) {
+  const grille = document.createElement("div");
+  grille.className = "grille";
+  for (const col of COLONNES) {
+    const champ = document.createElement("div");
+    champ.className = "champ";
+    const label = document.createElement("label");
+    label.textContent = col;
+    const input = document.createElement("input");
+    input.name = col;
+    input.value = p[col] || "";
+    champ.append(label, input);
+    grille.append(champ);
+  }
+  const actions = document.createElement("div");
+  actions.className = "actions";
+  const enregistrer = document.createElement("button");
+  enregistrer.textContent = "Enregistrer";
+  enregistrer.addEventListener("click", async () => {
+    const donnees = {};
+    for (const input of grille.querySelectorAll("input")) donnees[input.name] = input.value;
+    const rep = await fetch(`/api/prospects/${p.index}`, {
+      method: "PUT",
+      headers: { "Content-Type": "application/json" },
+      body: JSON.stringify(donnees),
+    });
+    if (rep.ok) chargerListe();
+  });
+  actions.append(enregistrer);
+  detail.append(grille, actions);
+}
+
+$("recherche").addEventListener("input", afficherListe);
+
+chargerListe();
+</script>
+</body>
+</html>