iTrameur | Nuages des mots

iTrameur — 种族歧视

Dictionnaire par fréquence

Après avoir introduit le fichier txt dans le site iTrameur, on obtient 49362 occurrences et 13124 formes, ce qui est assez considérable.

Parmi ces occurrences, le mot qui apparaît le plus fréquemment, c'est 美国 , soit Les États-Unis. Ce terme apparaît plus fréquemment que notre mot cible. Les mots les plus fréquents sont ensuite "être humain", "Chine", "asiatiques" et "Les Noirs".

La fréquence est tellement élevée du mot « États-Unis », qu'elle attire notre attention et nous amène à constater que la discrimination raciale est avant tout associée aux États-Unis dans le corpus chinois. Cela nous rappelle aussi les fréquents incidents de discrimination raciale aux États-Unis qui se sont déroulés ces derniers temps. Le terme « black lives matter » possède aussi une fréquence élevée qui peut être liée aux rapports fréquents de cette série d'événements par les sites web chinois.

Basés sur ce tableau, nous pouvons également découvrir que la discrimination raciale dans le corpus chinois concerne également l'être humain lui-même. Et probablement les Asiatiques et les Chinois occupent une place plus importante que les Noirs dans la discussion, ce qui constitue l'une des caractéristiques du corpus chinois.


cndict1






Segments Répétés

Dans ce tableau, nous nous efforçons d'examiner les 10 groupes de mots les plus fréquemment utilisés les uns avec les autres dans le texte, soit les Segments Répétés. Sans surprise, le premier groupe "Amérique + société" fait écho au mot à haute fréquence que nous avons explorée dans la section précédente. En outre, on constate que les trois premiers se limitent presque tous au même thème : la discrimination raciale dont souffrent les Noires d'ascendance africaine dans la société américaine. Ainsi, en combinant ce qu’on a vu dans le dictionnaire, on peut conclure que les Noirs restent le sujet et l'argument dominant dans la discussion sur la discrimination raciale dans le corpus chinois. Ils sont suivis par les Chinois et les Asiatiques.


cndict1





Réseau de cooccurrences

Le réseau de cooccurrences permet une visualisation interactive des données pour l’analyse. Auparavant, j'ai utilisé CiteSpace et Gephi pour créer des réseaux de relations cooccurrentes. Dans iTrameur, j'ai été surpris de constater qu'il existe également un outil pour la visualisation du réseau de cooccurrences, centré sur le mot cible « discrimination raciale ». L'image à droite donne une vue plus complète des autres mots qui apparaissent à côté du mot cible: les lignes étant de la même épaisseur, mais on peut observer les chiffres représentant la fréquence des mots de cooccurrence, et les nuances représentant la proximité de la relation avec le mot cible.

Les mots les plus fréquemment associés à la discrimination raciale sont "s'opposer" et "éliminer", ce qui montre bien l'attitude générale à adopter face à la "discrimination raciale" en tant que maladie sociale. Le tableau couvre un grand nombre de mots cooccurrents, mais il est difficile de voir en détail leur lien avec le mot cible. Nous en parlerons donc dans la section suivante.

iTrameur a calculé les 50 mots les plus associés au mot cible en considérant la fréquence des mots et leurs cooccurrences. Les trois premiers mots sont "s'opposer", "éliminer" et « anti-», ce qui correspond à notre analyse ci-dessus. Le quatrième mot est "préjugé" et le cinquième est "ego", qui sont liés au concept d'"identité personnelle" du psychologue britannique George Herbert Meade. Associé à la discrimination raciale, ce concept a évolué vers un préjugé racial, qui désigne les opinions et sentiments péjoratifs établis sur des critères d'appréciations sommaires envers des membres d'une autre race considérée comme inférieure.






cndict1

Les mots de coocurences avec le mot cible

Nous avons pu observer une relation directe entre les préjugés raciaux et la discrimination raciale. Les préjugés raciaux sont le résultat de la discrimination raciale et se retrouvent dans les sociétés où la race est discriminée dans le monde. Comme la race jaune est souvent la partie discriminée dans la communauté internationale, il est légitime et raisonnable de trouver dans le corpus chinois que les médias en ligne éduquent et éclairent la population sur ce phénomène.

Nous constatons enfin que le mot « racisme » apparaît également avec une fréquence élevée, mais qu'il coexiste moins fréquemment avec le mot cible, de sorte que nous suggérons qu'il peut exister une relation de mutuellement substitutive entre les deux mots, qui sont souvent confondus.








Tableau de concordances

D'après la fréquence des cooccurrences dans le graphique ci-dessus, les États-Unis restent le meilleur "ami" du mot cible « discrimination raciale". À droite, on peut voir plus spécifiquement les cas entre le mot cible et d'autres mots. Le graphique montre seulement une page parmi les 49 pages.

En combinant l'analyse ci-dessus avec les exemples spécifiques, nous pouvons conclure que dans le corpus chinois, il n'existe pas beaucoup de mots négatifs qui sont associés à la discrimination qui existe en Chine. Mais les mots "préjuges" et "identité" sont souvent mentionnés avec la discrimination raciale pour propager au peuple l'attitude correcte devant la discrimination. Au contraire, nous trouvons une quantité énorme des critiques contre ce phénomène dans les autres pays, parmi lesquels le plus représentatif est les États-Unis. Les États-Unis sont devenus synonymes de "discrimination raciale". Le corpus chinois ne met pas seulement l'accent sur la "discrimination à l'égard des Noirs" dans la société américaine, mais critique également l'injustice à l'égard des Asiatiques. "Chinois américains", "épidémie", « Covid-19 » , "slanted eyes", "virus", « épidémie »... Ces termes et expressions sont bien caractéristiques et représentent la discrimination raciale dont sont victimes les personnes de race jaune et les Asiatiques au cours de la pandémie. De multiples termes sont également représentatifs des nombreuses descriptions d'émeutes noires aux États-Unis, comme les " émeutes de Kenosha " et le mouvement "Black Lives Matter": "ascendance africaine", "virulent", "violent", "incidents", et " Wisconsin ".

Les médias étant le second gouvernement de l'État, il est possible de supposer que les critiques du corpus chinois dirigé contre les États-Unis sont peut-être le produit de la détérioration progressive des relations entre les deux pays.


cndict1





Nuages des Mots

cndict1

Nuage de mots chinois


"种族歧视"


La création du nuage des mots est toujours quelque chose d'aussi dure que gratifiante. Le nuage de mots permet une présentation plus esthétique des statistiques sur la fréquence des mots. Ce nuage de mots a été généré sur la base des résultats de la segmentation des mots de jieba. J'ai ajouté une image de fond au nuage de mots pour qu'il ressemble à un poing tricolore. Enfin, j'ai essayé d'ajouter tous les stopwords, mais il y a encore beaucoup de mots vides, ce qui, je pense, pourrait être dû à des problèmes d’encodage et c'est quelque chose qui devrait être amélioré.

Observation:

À l'instar des résultats de l'analyse d'iTrameur, nous avons constaté que les mots à haute fréquence étaient principalement "américain", "raciste", "asiatique", "noir", "société", etc. En dehors des États-Unis et de la Chine, les autres pays ont rarement été évoqués.





Conclusion

Conclusion du corpus chinois


"种族歧视"


TAL relie le traitement automatique du langage naturel à l'informatique. Sur la base du langage naturel et du langage écrit ou parlé, les ordinateurs peuvent analyser, comprendre et traiter le langage humain. Son objectif fondamental est de nous donner une meilleure compréhension et application de la langue, de sa culture et de la société. En combinant les analyses sur iTrameur et le nuage de mots, et tous les résultats obtenus, j'ai constaté que le corpus chinois a ses propres spécificités. Dans le cas de la discrimination raciale, elle est confrontée à une dualité qui désigne à la fois les Noirs et les Jaunes. Cependant, autour de ces races, nous constatons que le corpus est très différent en termes de pertinence et d'implication. Dans le cas de la discrimination raciale à l'encontre les Jaunes, ou bien les Chinois, il y a un sentiment de colère, un appel et une demande pour dénoncer l'injustice dont souffrent les Jaunes dans le monde. Cependant, dans le cas de la discrimination contre les Noirs, le corpus relie presque exclusivement ce problème racial aux États-Unis. Nous pensons que la série de mouvements racistes blancs aux États-Unis ces dernières années, ainsi que le nombre croissant de crimes raciaux, est l'une des raisons pour lesquelles l'objet "États-Unis" est constamment évoqué dans la discussion, et que cette caractéristique est également due à la détérioration des relations entre les deux pays. Ainsi, le racisme peut être considéré comme un sujet thématique pour la guerre d'opinion entre les pays.