# frozen_string_literal: true

class EmailChecker
  # Extracted 100 most used domain on our users table [june 2024]
  # + all .gouv.fr domain on our users table
  # + all .ac-xxx on our users table
  KNOWN_DOMAINS = [
    'gmail.com',
    'hotmail.fr',
    'orange.fr',
    'yahoo.fr',
    'hotmail.com',
    'outlook.fr',
    'wanadoo.fr',
    'free.fr',
    'yahoo.com',
    'icloud.com',
    'laposte.net',
    'live.fr',
    'sfr.fr',
    'outlook.com',
    'neuf.fr',
    'aol.com',
    'bbox.fr',
    'msn.com',
    'me.com',
    'gmx.fr',
    'protonmail.com',
    'club-internet.fr',
    'live.com',
    'ymail.com',
    'ars.sante.fr',
    'mail.ru',
    'cegetel.net',
    'numericable.fr',
    'aliceadsl.fr',
    'comcast.net',
    'assurance-maladie.fr',
    'mac.com',
    'naver.com',
    'airbus.com',
    'justice.fr',
    'pole-emploi.fr',
    'educagri.fr',
    'aphp.fr',
    'netcourrier.com',
    'dbmail.com',
    'aol.fr',
    'qq.com',
    'hotmail.co.uk',
    'yahoo.co.uk',
    'proxima-mail.fr',
    'yahoo.com.br',
    'sciencespo.fr',
    'gmx.com',
    'etu.univ-st-etienne.fr',
    'yahoo.ca',
    '163.com',
    'francetravail.fr',
    'mail.pf',
    'nantesmetropole.fr',
    'hotmail.it',
    'sbcglobal.net',
    'noos.fr',
    'ird.fr',
    'safrangroup.com',
    'croix-rouge.fr',
    'eiffage.com',
    'veolia.com',
    'notaires.fr',
    'nordnet.fr',
    'videotron.ca',
    'paris.fr',
    'lilo.org',
    'mfr.asso.fr',
    'yopmail.com',
    'ukr.net',
    'onf.fr',
    'stellantis.com',
    '9online.fr',
    'atmp50.fr',
    'engie.com',
    'libertysurf.fr',
    'mailo.com',
    'auchan.fr',
    'verizon.net',
    'rocketmail.com',
    'mpsa.com',
    'entrepreneur.fr',
    'googlemail.com',
    'arcelormittal.com',
    'groupe-sos.org',
    'proton.me',
    'att.net',
    'pm.me',
    'orange.com',
    'abv.bg',
    'yahoo.es',
    'creditmutuel.fr',
    'yandex.ru',
    'essec.edu',
    'urssaf.fr',
    'bpifrance.fr',
    'uol.com.br',
    'suez.com',
    'univ-st-etienne.fr',
    'korian.fr',
    'developpement-durable.gouv.fr',
    'modernisation.gouv.fr',
    'social.gouv.fr',
    'emploi.gouv.fr',
    'agriculture.gouv.fr',
    'intradef.gouv.fr',
    'interieur.gouv.fr',
    'oise.gouv.fr',
    'direccte.gouv.fr',
    'culture.gouv.fr',
    'pas-de-calais.gouv.fr',
    'finances.gouv.fr',
    'drieets.gouv.fr',
    'drjscs.gouv.fr',
    'sg.social.gouv.fr',
    'martinique.pref.gouv.fr',
    'beta.gouv.fr',
    'dieccte.gouv.fr',
    'cotes-darmor.gouv.fr',
    'vosges.gouv.fr',
    'developppement-durable.gouv.fr',
    'mayenne.gouv.fr',
    'aviation-civile.gouv.fr',
    'data.gouv.fr',
    'recherche.gouv.fr',
    'sante.gouv.fr',
    'paris-idf.gouv.fr',
    'guyane.gouv.fr',
    'douane.finances.gouv.fr',
    'cget.gouv.fr',
    'herault.gouv.fr',
    'loire-atlantique.gouv.fr',
    'manche.gouv.fr',
    'seine-maritime.gouv.fr',
    'dgccrf.finances.gouv.fr',
    'tarn-et-garonne.gouv.fr',
    'dila.gouv.fr',
    'diplomatie.gouv.fr',
    'haut-rhin.gouv.fr',
    'nord.gouv.fr',
    'bouches-du-rhone.gouv.fr',
    'alpes-de-haute-provence.gouv.fr',
    'hautes-alpes.gouv.fr',
    'alpes-maritimes.gouv.fr',
    'var.gouv.fr',
    'vaucluse.gouv.fr',
    'rhone.gouv.fr',
    'occitanie.gouv.fr',
    'ille-et-vilaine.gouv.fr',
    'finistere.gouv.fr',
    'aisne.gouv.fr',
    'indre.gouv.fr',
    'yvelines.gouv.fr',
    'bas-rhin.gouv.fr',
    'landes.gouv.fr',
    'haute-marne.gouv.fr',
    'correze.gouv.fr',
    'val-doise.gouv.fr',
    'seine-et-marne.gouv.fr',
    'essonne.gouv.fr',
    'calvados.gouv.fr',
    'charente-maritime.gouv.fr',
    'corse-du-sud.gouv.fr',
    'gironde.gouv.fr',
    'haute-corse.gouv.fr',
    'morbihan.gouv.fr',
    'pyrenees-atlantiques.gouv.fr',
    'pyrenees-orientales.gouv.fr',
    'somme.gouv.fr',
    'vendee.gouv.fr',
    'dgtresor.gouv.fr',
    'marne.gouv.fr',
    'auvergne-rhone-alpes.gouv.fr',
    'meurthe-et-moselle.gouv.fr',
    'pm.gouv.fr',
    'oncfs.gouv.fr',
    'orne.gouv.fr',
    'charente.gouv.fr',
    'travail.gouv.fr',
    'gard.gouv.fr',
    'maine-et-loire.gouv.fr',
    'moselle.gouv.fr',
    'outre-mer.gouv.fr',
    'jscs.gouv.fr',
    'haute-garonne.gouv.fr',
    'vienne.gouv.fr',
    'dordogne.gouv.fr',
    'eure.gouv.fr',
    'meuse.gouv.fr',
    'savoie.gouv.fr',
    'doubs.gouv.fr',
    'bfc.gouv.fr',
    'education.gouv.fr',
    'ariege.gouv.fr',
    'normandie.gouv.fr',
    'gendarmerie.interieur.gouv.fr',
    'ain.gouv.fr',
    'ardennes.gouv.fr',
    'drome.gouv.fr',
    'bretagne.gouv.fr',
    'paca.gouv.fr',
    'haute-saone.gouv.fr',
    'lot.gouv.fr',
    'dgfip.finances.gouv.fr',
    'aveyron.gouv.fr',
    'gers.gouv.fr',
    'tarn.gouv.fr',
    'aude.gouv.fr',
    'lozere.gouv.fr',
    'hautes-pyrenees.gouv.fr',
    'jeunesse-sports.gouv.fr',
    'alpes.maritimes.gouv.fr',
    'dreets.gouv.fr',
    'justice.gouv.fr',
    'sports.gouv.fr',
    'nouvelle-aquitaine.gouv.fr',
    'jura.gouv.fr',
    'haute-savoie.gouv.fr',
    'creuse.gouv.fr',
    'creps-poitiers.sports.gouv.fr',
    'equipement-agriculture.gouv.fr',
    'ira-metz.gouv.fr',
    'loire.gouv.fr',
    'defense.gouv.fr',
    'paris.gouv.fr',
    'ensm.sports.gouv.fr',
    'isere.gouv.fr',
    'haute-loire.gouv.fr',
    'cantal.gouv.fr',
    'lot-et-garonne.gouv.fr',
    'reunion.pref.gouv.fr',
    'loiret.gouv.fr',
    'indre-et-loire.gouv.fr',
    'eleve.ira-metz.gouv.fr',
    'deux-sevres.gouv.fr',
    'inao.gouv.fr',
    'franceconnect.gouv.fr',
    'essone.gouv.fr',
    'workinfrance.beta.gouv.fr',
    'seine-saint-denis.gouv.fr',
    'val-de-marne.gouv.fr',
    'morbihan.pref.gouv.fr',
    'externes.justice.gouv.fr',
    'haute-vienne.gouv.fr',
    'territoire-de-belfort.gouv.fr',
    'creps-reunion.sports.gouv.fr',
    'creps-centre.sports.gouv.fr',
    'creps-rhonealpes.sports.gouv.fr',
    'creps-montpellier.sports.gouv.fr',
    'nord.pref.gouv.fr',
    'charente-maritime.pref.gouv.fr',
    'cher.gouv.fr',
    'cote-dor.gouv.fr',
    'ssi.gouv.fr',
    'ira.gouv.fr',
    'pays-de-la-loire.gouv.fr',
    'loir-et-cher.gouv.fr',
    'saone-et-loire.gouv.fr',
    'enseignementsup.gouv.fr',
    'eure-et-loir.gouv.fr',
    'yonne.gouv.fr',
    'guadeloupe.pref.gouv.fr',
    'centre-val-de-loire.gouv.fr',
    'entreprise.api.gouv.fr',
    'grand-est.gouv.fr',
    'sarthe.gouv.fr',
    'sarthe.pref.gouv.fr',
    'puy-de-dome.gouv.fr',
    'externes.sante.gouv.fr',
    'allier.gouv.fr',
    'aube.gouv.fr',
    'nievre.gouv.fr',
    'ardeche.gouv.fr',
    'api.gouv.fr',
    'hauts-de-seine.gouv.fr',
    'hauts-de-france.gouv.fr',
    'temp-beta.gouv.fr',
    'def.gouv.fr',
    'particulier.api.gouv.fr',
    'ira-lille.gouv.fr',
    'haute-saone.pref.gouv.fr',
    'yvelines.pref.gouv.fr',
    'sgg.pm.gouv.fr',
    'anah.gouv.fr',
    'corse.gouv.fr',
    'mayenne.pref.gouv.fr',
    'cote-dor.pref.gouv.fr',
    'guyane.pref.gouv.fr',
    'ira-nantes.gouv.fr',
    'igas.gouv.fr',
    'tarn.pref.gouv.fr',
    'martinique.gouv.fr',
    'creps-paca.sports.gouv.fr',
    'ofb.gouv.fr',
    'loir-et-cher.pref.gouv.fr',
    'indre-et-loire.pref.gouv.fr',
    'polynesie-francaise.pref.gouv.fr',
    'scl.finances.gouv.fr',
    'numerique.gouv.fr',
    'cantal.pref.gouv.fr',
    'territoire-de-belfort.pref.gouv.fr',
    'creps-wattignies.sports.gouv.fr',
    'vienne.pref.gouv.fr',
    'ardennes.pref.gouv.fr',
    'creps-strasbourg.sports.gouv.fr',
    'creps-dijon.sports.gouv.fr',
    'ara.gouv.fr',
    'sgdsn.gouv.fr',
    'pays-de-la-loire.pref.gouv.fr',
    'anct.gouv.fr',
    'creps-pap.sports.gouv.fr',
    'sgae.gouv.fr',
    'esnm.sports.gouv.fr',
    'nouvelle-caledonie.gouv.fr',
    'deets.gouv.fr',
    'mayotte.gouv.fr',
    'creps-bordeaux.sports.gouv.fr',
    'civs.gouv.fr',
    'iga.interieur.gouv.fr',
    'cab.travail.gouv.fr',
    'ira-bastia.gouv.fr',
    'ira-lyon.gouv.fr',
    'creps-lorraine.sports.gouv.fr',
    'dihal.gouv.fr',
    'ofpra.gouv.fr',
    'mayotte.pref.gouv.fr',
    'strategie.gouv.fr',
    'territoires.gouv.fr',
    'dgcl.gouv.fr',
    'doubs.pref.gouv.fr',
    'service-civique.gouv.fr',
    'maine-et-loire.pref.gouv.fr',
    'envsn.sports.gouv.fr',
    'wallis-et-futuna.pref.gouv.fr',
    'gendarmerie.defense.gouv.fr',
    'anlci.gouv.fr',
    'cabinets.finances.gouv.fr',
    'seine-maritime.pref.gouv.fr',
    'promo46.ira-metz.gouv.fr',
    'aisne.pref.gouv.fr',
    'sportsdenature.gouv.fr',
    'loire-atlantique.pref.gouv.fr',
    'aude.pref.gouv.fr',
    'premier-ministre.gouv.fr',
    'igf.finances.gouv.fr',
    'eleves.ira-bastia.gouv.fr',
    'igesr.gouv.fr',
    'alpc.gouv.fr',
    'externes.emploi.gouv.fr',
    'prestataire.finances.gouv.fr',
    'gironde.pref.gouv.fr',
    'premar-atlantique.gouv.fr',
    'creps-toulouse.sports.gouv.fr',
    'guadeloupe.gouv.fr',
    'cybermalveillance.gouv.fr',
    'dicod.defense.gouv.fr',
    'creps-vichy.sports.gouv.fr',
    'aft.gouv.fr',
    'equipement.gouv.fr',
    'academie.defense.gouv.fr',
    'aube.pref.gouv.fr',
    'seine-et-marne.pref.gouv.fr',
    'pyrenees-orientales.pref.gouv.fr',
    'haute-garonne.pref.gouv.fr',
    'haut-rhin.pref.gouv.fr',
    'seine-saint-denis.pref.gouv.fr',
    'dcstep.gouv.fr',
    'promo47.ira-metz.gouv.fr',
    'trackdechets.beta.gouv.fr',
    'val-de-marne.pref.gouv.fr',
    'fabrique.social.gouv.fr',
    'agrasc.gouv.fr',
    'indre.pref.gouv.fr',
    'tarn-et-garonne.pref.gouv.fr',
    'corse.pref.gouv.fr',
    'bas-rhin.pref.gouv.fr',
    'inclusion.beta.gouv.fr',
    'hauts-de-seine.pref.gouv.fr',
    'loiret.pref.gouv.fr',
    'essonne.pref.gouv.fr',
    'territoires-industrie.gouv.fr',
    'spm975.gouv.fr',
    'saint-barth-saint-martin.gouv.fr',
    'judiciaire.interieur.gouv.fr',
    'mer.gouv.fr',
    'premar-manche.gouv.fr',
    'haute-normandie.pref.gouv.fr',
    'prestataire.modernisation.gouv.fr',
    'covoiturage.beta.gouv.fr',
    'promo48.ira-metz.gouv.fr',
    'france-services.gouv.fr',
    'ddets.gouv.fr',
    'afa.gouv.fr',
    'externes.social.gouv.fr',
    'vosges.pref.gouv.fr',
    'reunion.gouv.fr',
    'rhone.pref.gouv.fr',
    'alpes-maritimes.pref.gouv.fr',
    'gard.pref.gouv.fr',
    'oise.pref.gouv.fr',
    'creps-reims.sports.gouv.fr',
    'bouches-du-rhone.pref.gouv.fr',
    'esante.gouv.fr',
    'rhone-alpes.pref.gouv.fr',
    'finistere.pref.gouv.fr',
    'ops-bss.defense.gouv.fr',
    'orne.pref.gouv.fr',
    'transformation.gouv.fr',
    'cbcm.social.gouv.fr',
    'recosante.beta.gouv.fr',
    'pas-de-calais.pref.gouv.fr',
    'promo49.ira-metz.gouv.fr',
    'paca.pref.gouv.fr',
    'meurthe-et-moselle.pref.gouv.fr',
    'externes.sg.social.gouv.fr',
    'puy-de-dome.pref.gouv.fr',
    'academie.def.gouv.fr',
    'tarn.gouv.frd81intranet.ddcspp.tarn.gouv.fr',
    'agriculture-equipement.gouv.fr',
    'creps-idf.sports.gouv.fr',
    'eleve.ira-nantes.gouv.fr',
    'cohesion-territoires.gouv.fr',
    'ariege.pref.gouv.fr',
    'pyrenees-atlantiques.pref.gouv.fr',
    'hautes-pyrenees.pref.gouv.fr',
    'lot-et-garonne.pref.gouv.fr',
    'loire.pref.gouv.fr',
    'info-routiere.gouv.fr',
    'diges.gouv.fr',
    'insp.gouv.fr',
    'creps-pdl.sports.gouv.fr',
    'ddc.social.gouv.fr',
    'eleve.insp.gouv.fr',
    'val-doise.pref.gouv.fr',
    'montsaintmichel.gouv.fr',
    'st-cyr.terre-net.defense.gouv.fr',
    '.finances.gouv.fr',
    'logement.gouv.fr',
    'cotes-darmor.pref.gouv.fr',
    'marne.pref.gouv.fr',
    'herault.pref.gouv.fr',
    'viennne.gouv.fr',
    'landes.pref.gouv.fr',
    'moselle.pref.gouv.fr',
    'saone-et-loire.pref.gouv.fr',
    'bmpm.gouv.fr',
    'ecologie-territoires.gouv.fr',
    'nievre.pref.gouv.fr',
    'hautes-pyrénées.gouv.fr',
    'gic.gouv.fr',
    'industrie.gouv.fr',
    'lot.pref.gouv.fr',
    'plan.gouv.fr',
    'internet.gouv.fr',
    'mesads.beta.gouv.fr',
    'gers.pref.gouv.fr',
    'dordogne.pref.gouv.fr',
    'somme.pref.gouv.fr',
    'datasubvention.beta.gouv.fr',
    'anc.gouv.fr',
    'premar-mediterranee.gouv.fr',
    'ille-et-vilaine.pref.gouv.fr',
    'eure-et-loir.pref.gouv.fr',
    'prestataires.pm.gouv.fr',
    'snu.gouv.fr',
    'code.gouv.fr',
    'alsace.pref.gouv.fr',
    'haute-vienne.pref.gouv.fr',
    'yonne.pref.gouv.fr',
    'bretagne.pref.gouv.fr',
    'mastere.insp.gouv.fr',
    'cada.pm.gouv.fr',
    'creuse.pref.gouv.fr',
    'ecologie.gouv.fr',
    'midi-pyrenees.pref.gouv.fr',
    'promo54.ira-metz.gouv.fr',
    'var.pref.gouv.fr',
    'alpes-de-haute-provence.pref.gouv.fr',
    'mail.numerique.gouv.fr',
    'france-identite.gouv.fr',
    'transport.data.gouv.fr',
    'allier.pref.gouv.fr',
    'dilhal.gouv.fr',
    'ardeche.pref.gouv.fr',
    'haute-corse.pref.gouv.fr',
    'intérieur.gouv.fr',
    'ddfip.gouv.fr',
    'calvados.pref.gouv.fr',
    'territoir-de-belfort.gouv.fr',
    'nor.gouv.fr',
    'creps-occitanie.sports.gouv.fr',
    'developpement-durabe.gouv.fr',
    'educ.nat.gouv.fr',
    'developpement-duable.gouv.fr',
    'dgfip.finanes.gouv.fr',
    'loire-atlantqieu.gouv.fr',
    'promo55.ira-metz.gouv.fr',
    'haute-saône.gouv.fr',
    'developpement.durable.gouv.fr',
    'dreet.gouv.fr',
    'miprof.gouv.fr',
    'pref.guyane.gouv.fr',
    'developpement.gouv.fr',
    'gendamrerie.interieur.gouv.fr',
    'pyrenees-atlantique.gouv.fr',
    'apprentissage.beta.gouv.fr',
    'yveliens.gouv.fr',
    'justiice.gouv.fr',
    'cutlure.gouv.fr',
    'aidantsconnect.beta.gouv.fr',
    'developpement-durbale.gouv.fr',
    'sine-et-marne.gouv.fr',
    'sociale.gouv.fr',
    'develeoppement-durable.gouv.fr',
    'draaf.gouv.fr',
    'drets.gouv.fr',
    'ancli.gouv.fr',
    'finistrere.gouv.fr',
    'bourgogne.pref.gouv.fr',
    'ac-polynesie.pf',
    'ac-lille.fr',
    'ac-nantes.fr',
    'ac-martinique.fr',
    'ac-creteil.fr',
    'ac-toulouse.fr',
    'ac-amiensfr',
    'ac-amiens.fr',
    'ac-rennes.fr',
    'ac-strasbourg.fr',
    'ac-lyon.fr',
    'ac-versailles.fr',
    'ac-audit.fr',
    'ac-rouen.fr',
    'ac-reunion.fr',
    'ac-poitiers.fr',
    'ac-caen.fr',
    'ac-montpellier.fr',
    'ac-paris.fr',
    'ac-besancon.fr',
    'ac-nancy-metz.fr',
    'ac-aix-marseille.fr',
    'ac-grenoble.fr',
    'ac-corse.fr',
    'ac-nice.fr',
    'ac-orleans-tours.fr',
    'ac-guadeloupe.fr',
    'ac-reims.fr',
    'ac-mayotte.fr',
    'ac-clermont.fr',
    'ac-bordeaux.fr',
    'ac-limoges.fr',
    'ac-normandie.fr',
    'ac-dijon.fr',
    'ac-guyane.fr',
    'ac-transports.fr',
    'ac-arpajonnais.com',
    'ac-cned.fr',
    'ac-nettoyage.com',
    'ac-architectes.fr',
    'ac-ajaccio.corsica',
    'ac-noumea.nc',
    'ac-spm.fr',
    'ac-versailes.fr',
    'ac-polynesie.fr',
    'ac-experts.fr',
    'ac-creteil.com',
    'ac-smart-relocation.com',
    'ac-ec.pro',
    'ac-sas.fr',
    'ac-derma.de',
    'ac-or.com',
    'ac-baugeois.fr',
    'ac-5.ru',
    'ac-arles.fr',
    'ac-holding.net',
    'ac-mb.fr',
    'ac-wf.wf',
    'ac-brest-finistere.fr',
    'ac-leman.com',
    'ac-darboussier.fr',
    'ac-si.fr',
    'ac-bordeau.fr',
    'ac-gatinais.com',
    'ac-cheminots.fr',
    'ac-seyssinet.com',
    'ac-cannes.fr',
    'ac-prev.com',
    'ac-sologne.fr',
    'ac-rennes',
    'ac-courbevoie.com',
    'ac-ce.fr',
    'ac-architecte.fr',
    'ac-tions.org',
    'ac-pm.fr',
    'ac-avocats.com',
    'ac-talents-rh.com',
    'ac-louis.com',
    'ac-internet.fr',
    'ac-toulouse.com',
    'ac-escial.fr',
    'ac-environnement.com',
    'ac-academie.fr',
    'ac-poiters.fr',
    'ac-bordeux.fr',
    'ac-verseilles.fr',
    'ac-ais-marseille.fr',
    'ac-horizon.fr',
    'ac-bordeaux.ft',
    'ac-toulouses.fr',
    'ac-toulous.fr'
  ].freeze

  def self.check(email:)
    return { success: false } if email.blank?

    parsed_email = Mail::Address.new(EmailSanitizableConcern::EmailSanitizer.sanitize(email))
    return { success: false } if parsed_email.domain.blank?

    return { success: true } if KNOWN_DOMAINS.any? { _1 == parsed_email.domain }

    similar_domains = closest_domains(domain: parsed_email.domain)
    return { success: true } if similar_domains.empty?

    { success: true, suggestions: suggestions(parsed_email:, similar_domains:) }
  rescue Mail::Field::IncompleteParseError
    return { success: false }
  end

  private

  def self.closest_domains(domain:)
    KNOWN_DOMAINS.filter do |known_domain|
      close_by_distance_of(domain, known_domain, distance: 1) ||
      with_same_chars_and_close_by_distance_of(domain, known_domain, distance: 2)
    end
  end

  def self.close_by_distance_of(a, b, distance:)
    String::Similarity.levenshtein_distance(a, b) == distance
  end

  def self.with_same_chars_and_close_by_distance_of(a, b, distance:)
    close_by_distance_of(a, b, distance: 2) && a.chars.sort == b.chars.sort
  end

  def self.suggestions(parsed_email:, similar_domains:)
    similar_domains.map { Mail::Address.new("#{parsed_email.local}@#{_1}").to_s }
  end
end