Probleme de distribution: Reformulation simple


  • T

    Bonjour,

    Sous les conseil d'un internaute je reformule ma question de facon simple et sans considération physique.

    Je suis complétement bloquée dans mes recherche par ce probleme qu'il fait que je résoud:

    Je cherche à définir une fonction de probabilité dans un interval [a,c]. Cette fonction doit satifaire les conditions:
    Elle doit être decrite par deux fonctions:
    g(x) qui décrit la densite de probalilité de mon evenemeent x entre [a,c]
    h(x) qui décrit la densite de probalilité de mon evenemeent x entre [c,b]
    g(x) et h(x) doivent satisfaire:
    g(c)=h(c)
    g(a)=h(b)=0
    g(x)>0
    h(x)>0
    Integrale(g(x),x,a,c)+Integrale(h(x),x,c,b)=1
    Integrale(xg(x),x,a,c)+Integrale(xh(x),x,c,b)=0
    Une solution où une ou plusieurs de ces 4 integrale seraiet toujours nulle est a écarter.
    a, b et c sont des variables connues avec a negatif, b positif et c peut etre negatif ou positif.

    J'ai deja cherché différentes solutions pour des fonctions du type:

    1. g(x)=(x-a)^alpha;h(x)=(b-x)^beta
    2. g(x)=(x-a)exp(alphax);h(x)=(b-x)exp(betax)
    3. g(x)=(x-a)*exp(alpha+x);h(x)=(b-x)*exp(beta+x)

    Avec ces couples de fonction je ne trouve pas de solution....

    Pour ceux qui souhaite avoir la physique qu'il y a derriere ce probleme, voir mon precédent topis

    Merci pour votre aide.


  • W

    Salut,

    Je ne sais pas si tu cherches juste une fonction qui satisfait ce que tu dis ou un ensemble de fonctions mais voilà :
    Je pense que deux distributions normales (f(x)=exp(-(x-moy)^2/2sigma^2)/(√(2π)sigma)) satisferaient assez facilement :
    Integrale(x
    g(x),x,a,c)+Integrale(xh(x),x,c,b)=0.
    Pour cela, il faut décomposer :
    E[x entre a et inf(0,c) ]+E[x entre 0 et c]+E[x entre inf(0,c) et b]=0.
    ..............<0.........................< ou >0 ................... >0
    puis associer les bonnes densités à chaque espérance.
    Ensuite, il faut ajuster la variance, du genre mumumu_1−3</em>sigma1-3</em>sigma_13</em>sigma1=a pour g et mumumu_2+3∗sigma2+3*sigma_2+3sigma2=b pour h pour avoir des intervalles de confiances à 0.9975 (avec sigma écart-type et mu1mu_1mu1 moyenne de g ). Tu auras alors :
    1 ≤ Integrale(g(x),x,a,c)+Integrale(h(x),x,c,b) ≤ 2 .
    Il faut donc diviser chaque densité par un poids pour avoir =1.

    Voilà j'espère t'avoir un peu aidé,

    Tcho


  • W

    Salut,

    En fait j'ai réfléchi et il me semble que E[X entre a et b]=c en lisant ton premier post.
    En supposant que l'on modélise toujours par des lois normales.
    Alors cela donne 6 équations à six inconnues (deux poids, deux moyennes et deux variances) :
    1)g(c)=h(c)⇒p1f(c,mu1mu_1mu1,sigma1sigma_1sigma1)=p2f(c,mu2mu_2mu2,sigma2sigma_2sigma2)
    avec f(x,mu,sigma) la densité de la loi normale de moyenne mu et d'écart-type sigma.
    2)mu2)mu2)mu_1−3<em>sigma1-3<em>sigma_13<em>sigma1=a <-PAS BON
    3)mu3)mu3)mu_2+3</em>sigma2+3</em>sigma_2+3</em>sigma2=b <-PAS BON
    4)E[X]=c=(1/p4)E[X]=c=(1/p4)E[X]=c=(1/p_1)∗mu)*mu)mu_1+(1/p+(1/p+(1/p2)∗mu2)*mu_2)mu2
    5)p5)p5)p1∗Int</em>acg(x)dx+p2*Int</em>{a}^{c}g(x)dx+p_2Int</em>acg(x)dx+p2*Int{c}^{b}h(x)dx=1
    6)p6)p6)p_1+p2+p_2+p2=1
    A résoudre, non?


  • T

    J'ai l'impression que la fonction proposée est symétrique?

    Si je ne me trompe pas, elle ne pourra convenir puisque la fonction rechercher doit pouvoir satifaire n'importe quel couple (a,b) qui ne sont pas forcément symétrique par rapport à 0.


  • W

    Salut,

    Ce n'est pas symétrique : c'est un mélange de deux lois gaussiennes.
    (En fait, les poids associés à chaque gaussienne déforment la fonction.Seulement si p1=p2, la densité totale est symétrique).
    Les conditions que j'ai posé sur ce mélange sont :
    1)g(c)=h(c)
    2)La borne inférieure de l'intervalle de confiance à 99.75% du premier composant du mélange est égale à a.
    3)La borne supérieure de l'intervalle de confiance à 99.75% du second composant du mélange est égale à b.
    4)La moyenne des données est c.
    5)L'intégrale des deux densités est de 1
    6)La somme des deux poids est égale à 1.

    Le seul point ou je me suis peut être trompé est le fait que l'intervalle de confiance n'est pas mu1+3sigma1 pour g par exemple car le poids p1 modifie cet intervalle.
    En fait, ce n'est pas F1(3)=0.9975, mais F1(3)=p1
    0.9975 car la fonction de répartition est p1F(x) pour ce premier composant. Il faut trouver q tel que p1F(q)≈1. F étant la fonction de répartition d'une gaussienne de moyenne mu1 et de variance sigma1^2.

    Si tu possèdes assez de données, l'algorithme EM (voir sur google) permet de distinguer ce genre de mélange d'après les données (mais il détermine les densités en maximisant la vraisemblance et ne prend donc pas en compte les contraintes des bornes).


  • T

    WIWIWI

    4)La moyenne des données est c.


  • W

    Salut,

    Moi je m'intéresse plutot aux statistiques qu'à la physique ou l'analyse numérique donc mon point de vue ne convient peut-être pas au problème toutefois :

    Un mélange de gaussiennes n'est pas comparable à une gaussienne.
    En fait, je pense qu'on peut approximer correctement n'importe quelle densité avec un mélange de gaussiennes. C'est le principe des estimations par noyaux gaussiens par exemple qui permettent d'obtenir un tracé de n'importe quelle densité d'après les données (une sorte d'histogramme mais beaucoup plus fin).

    Une seule densité gaussienne multipliée par un poids est déformée (tassée) mais toujours symétrique et je peux comprendre que tu penses que cela tend trop rapidement vers 0 mais si tu utilises un mélange de densités gaussiennes, tu peux t'arranger pour insérer une gaussienne supplémentaire dans la queue de la première densité, ce qui permet de ralentir la tendance à tendre vers 0.(je sais pas si tu vois ce que je veux dire?). Mais ce problème restera toujours en l'infini (en physique, je pense que l'infini n'est pas très utilisé).
    En gros si tu estimes que cela tend trop vite au niveau des bornes, tu peux rajouter une composante gaussienne à ton mélange de deux gaussiennes à chaque borne, ce qui te donneras un mélange de quatre composantes gaussiennes.
    De cette manière, tu peux arriver à obtenir quelque chose de relativement précis. Ensuite, une méthode consiste à regarder le kurtosis et le skewness obtenus par le mélange et à les comparer aux familles de loi du diagramme de Pearson pour obtenir une loi plus claire.

    Sinon si la moyenne est zéro alors 4) est E[X]=0=(1/p1)*mu1+(1/p2)*mu2.

    Voilà,
    bon courage


  • T

    ok. Mais sincerement mon niveau en mathématique ne me permet de trouver une solution à partir de ton message. Je le reprendrai plus calmement demain matin. Mais la pour l'instant je ne vois pas du tout comment proceder


Se connecter pour répondre