Inégalité de concentration


  • Christophe Christophe

    Bonjour à tous,

    Voici l'énoncé d'un exercice qui me pose problème dès la 3° question .
    Après cet énoncé je vais vous développer ma réponse à la question 3) qui aboutit à une faute ..Pourriez-vous m'indiquer à quelle étape je commets cette faute svp ? Merci par avance 🙂

    Enoncé

    Une élection oppose deux candidats A et B. Soit 𝑝 la proportion d'électeurs, dans la population totale, décidés à voter pour le candidat A. On souhaite estimer cette proportion
    𝑝 inconnue .
    On effectue un sondage auprès de 𝑛 personnes. On suppose que chaque personne interrogée donne son intention réelle de vote. La population est suffisamment importante pour assimiler le choix de chaque personne à un tirage aléatoire avec remise.
    On note 𝑋𝑖 la variable aléatoire qui vaut 1 si la i-ème personne interrogée vote pour A, et 0 sinon.
    Soit la moyenne: Mn=X1+X2+...+XnnM_n=\frac{X_1+X_2+...+X_n}{n}Mn=nX1+X2+...+Xn

    1. Montrer que, pour tout 𝑝 dans [0;1], on a:
      𝑝(1−𝑝)≤14𝑝(1−𝑝)≤\frac{1}{4}p(1p)41

    2. De quelle nature sont chacune des 𝑋𝑖 ? Donner leur espérance et leur variance.

    3. Montrer à l'aide de l'inégalité de concentration que: pour tout réel 𝛿 strictement positif, on a:
      𝑝(𝑀𝑛−δ<𝑝<𝑀𝑛+δ)≥1−114𝑛δ²𝑝(𝑀_𝑛−\delta\lt 𝑝\lt 𝑀_𝑛+\delta)\ge 1−1\frac{1}{4𝑛\delta²}p(Mnδ<p<Mn+δ)114nδ²1

    Si 𝑓 est la valeur prise par 𝑀𝑛𝑀_𝑛Mn lors du sondage, on dit alors que l'intervalle 𝐼=]𝑓−𝛿;𝑓+𝛿[ est un intervalle de confiance pour 𝑝 au niveau de confiance supérieur ou égal à 1−14nδ²1−\frac{1}{4n\delta²}14nδ²1

    1. Le sondage auprès de 𝑛=1000 personnes donne une fréquence de votants pour A égale à
      55%. Un intervalle de confiance pour 𝑝 est alors ]0,55−𝛿;0,55+𝛿[.
      On veut que cet intervalle de confiance se trouve à un niveau supérieur ou égal à 0,95.
      Montrer qu'il suffit que 𝛿≥𝑎 avec 𝑎≈0,0707
      .

    2. On prend 𝛿=0,071. Donner alors l'intervalle de confiance de 𝑝 au niveau supérieur ou égal à 0,95.
      Peut-on affirmer que 𝑝 est strictement supérieur à 50% avec un niveau de confiance supérieur à 0,95?

    3. Le candidat A souhaite que l'amplitude de l'intervalle de confiance au seuil de 0,95 soit de
      4% maximum. Combien de personnes doit-on interroger au minimum?

    Mes réponses

    1. et 2 pas de difficulté.

    2. En utilisant l'inégalité de concentration : p(∣Mn−E(X)∣≥δ)≤V(X)nδ²p(\left|M_n-E(X)\right|\geq\delta)\le \frac{V(X)}{nδ²}p(MnE(X)δ)nδ²V(X).

    Dans cette formule je remplaceE(X)E(X)E(X) par ppp et VVV par n(1−p)n(1-p)n(1p) car nous sommes dans une loi de Bernoulli. On obtient donc :
    p(∣Mn−p∣≥δ)≤p(1−p)nδ²p(\left|M_n-p\right|\geq\delta)\le \frac{p(1-p)}{nδ²}p(Mnpδ)nδ²p(1p).

    Dans 1) on a montré que 𝑝(1−𝑝)≤14𝑝(1−𝑝)≤\frac{1}{4}p(1p)41. On intègre donc cela à l'inégalité précédente et on obtient :
    p(∣Mn−p∣≥δ)≤14nδ²p(\left|M_n-p\right|\geq\delta)\le \frac{1}{4nδ²}p(Mnpδ)4nδ²1

    Transformons cette inégalité en remplaçant le membre de gauche par son événement contraire. On obtient :

    1−p(∣Mn−p∣≥δ)<14nδ²1-p(\left|M_n-p\right|\geq\delta)\lt \frac{1}{4nδ²}1p(Mnpδ)<4nδ²1

    On soustrait 1 et on obtient : −p(∣Mn−p∣≥δ)<−1+14nδ²-p(\left|M_n-p\right|\geq\delta)\lt -1+\frac{1}{4nδ²}p(Mnpδ)<1+4nδ²1

    On divise par −1-11 (on change donc le sens de l'inégalité ). On obtient :

    p(∣Mn−p∣≥δ)>1−14nδ²p(\left|M_n-p\right|\geq\delta)\gt 1-\frac{1}{4nδ²}p(Mnpδ)>14nδ²1

    On résoud p(∣Mn−p∣≥δ)p(\left|M_n-p\right|\geq\delta)p(Mnpδ)

    Mn−p≥δM_n-p\geq\deltaMnpδ ___________________et ___________ p−Mn≥δp-M_n\geq\deltapMnδ
    ⇔p≤Mn−δ\Leftrightarrow p\le M_n-\deltapMnδ __________________________⇔p≤Mn−δ\Leftrightarrow p\le M_n-\deltapMnδ

    Soit en réunissant le tout : Mn+δ≤p≤Mn−δM_n+\delta\le p\le M_n-\deltaMn+δpMnδ

    Ce qui maheureusement pour moi contredit ce qui est demandé de prouver 😞
    J'ai beau chercher je ne trouve pas ma coquille ... Pourriez-vous m'indiquer où elle se cache svp afin que je puisse continuer l'exercice ?
    Merci par avance 🙂


  • mtschoon

    @Christophe-Christophe , bonsoir,

    J'ai seulement regardé le début de ton explication à la question 3 (que tu as appelé 2, il me semble)

    Je comprends mal...

    On parle de loi de Bernoulli que lorsqu'on a une épreuve.
    E(X)=pE(X)=pE(X)=p et V(X)=p(1−p)V(X)=p(1-p)V(X)=p(1p)

    On parle de loi binomiale lorsqu'on à n épreuves (répétées indépendantes)
    E(X)=npE(X)=npE(X)=np et V(X)=np(1−p)V(X)=np(1-p)V(X)=np(1p)

    Regarde les liens ici :
    https://www.bibmath.net/dico/index.php?action=affiche&quoi=./l/loibernoulli.html

    https://www.bibmath.net/dico/index.php?action=affiche&quoi=./l/loibinomiale.html


  • Christophe Christophe

    Bonjour @mtschoon et merci pour ton temps accordé ... Cependant je ne comprends pas ta remarque ... je connais la différence entre loi de Bernoulli et loi Binomiale .. Mais ma question ne portait pas sur ce point ...A moins que je ne vois pas le rapport entre ta précision et ma question et dans ce cas je te prie de m'en excuser 🙂


  • mtschoon

    @Christophe-Christophe , bonjour,

    @Christophe-Christophe a dit dans Inégalité de concentration

    Dans cette formule je remplace E(X) par p et V par n(1−p) car nous sommes dans une loi de Bernoulli.

    Dans la loi de Bernoulli, E(X)=pE(X)=pE(X)=p et V(X)=p(1−p)\boxed{V(X)=p(1-p)}V(X)=p(1p) alors que tu as écris : V(X)=n(1−p)V(X)=n(1-p)V(X)=n(1p)
    C'est cela que je t'ai signalé : Tu as mis ′′n′′''n''n au lieu de ′′p′′''p''p

    De plus , dans la loi de Bernoulli, il n'y a pas de nnn vu qu'il y a qu'une seule épreuve ( en bref, n=1n=1n=1)
    (Regarde le lien)

    Remarque :
    Si j'ai bien lu, tu as un sondage de nnn personnes donc tu as nnn épreuves.
    L'énoncé précise : "La population est suffisamment importante pour assimiler le choix de chaque personne à un tirage aléatoire avec remise".
    Tu es donc dans les conditions d'utilisation d'une loi binomiale.

    Je n'ai pas regardé la suite de tes calculs, car le début m'a gênée.
    D'autres le feront peut-être.

    Bonne réflexion.


  • Christophe Christophe

    Bonjour @mtschoon et merci à nouveau pour ta réponse ...

    Oui effectivement j'ai fait une faute de frappe au temps pour moi 🙂

    Par contre ça ne change pas grand chose car dès la 2° formule je corrige cette faute de frappe et je continue mes calculs sans cette boulette ... Et ma question porte sur le reste 🙂


  • mtschoon

    @Christophe-Christophe , bonjour,

    La "boulette" de départ étant clarifiée, je regarde ce qui est écrit après.

    Rappel : lorsqu'on multiplie une inégalité par un nombre négatif, on change le sens de cette inégalité.

    Tu as p(∣Mn−p∣≤δ)≤14nδ2p(|M_n-p|\le \delta)\le \dfrac{1}{4n\delta^2}p(Mnpδ)4nδ21

    En multipliant par −1-11,
    −p(∣Mn−p∣≤δ)≥−14nδ2-p(|M_n-p|\le \delta)\ge -\dfrac{1}{4n\delta^2}p(Mnpδ)4nδ21

    En ajoutant 111 à chaque membre ( on ne change pas le sens de l'inégalité):
    1−p(∣Mn−p∣≤δ)≥1−14nδ21-p(|M_n-p|\le \delta)\ge 1-\dfrac{1}{4n\delta^2}1p(Mnpδ)14nδ21

    Revois tes calculs .


  • mtschoon

    @Christophe-Christophe ,

    Si besoin, regarde ici, avec soin, les propriétés relatives aux inégalités.
    Je pense que c'est cela qui te manque.

    https://www.logamaths.fr/proprietes-des-inegalites-dans-r/


Se connecter pour répondre