著名医師による解説が無料で読めます
すると翻訳の精度が向上します
Covid-19の広がりは、世界的な健康上の懸念をもたらしました。ソーシャルメディアは、それに関するニュースや意見を共有するためにますます使用されています。リソースを最適かつ適切に利用するには、状況の現実的な評価が必要です。この研究では、監視された機械学習アプローチを使用して、Covid-19 Tweetsセンチメント分析を実行します。ツイートからのCovid-19感情の特定は、現在のパンデミックの状況をより適切に処理するための情報に基づいた決定を可能にするでしょう。使用されているデータセットは、IEEEデータポートで提供されているIDを使用してTwitterから抽出されます。ツイートは、Tweepy Libraryを使用する社内で構築されたCrawlerによって抽出されます。データセットは、前処理技術を使用してクリーニングされ、TextBlobライブラリを使用して感情が抽出されます。この作業の貢献は、提案された機能セットを使用したさまざまな機械学習分類器のパフォーマンス評価です。このセットは、単語の袋と周波数逆のドキュメント周波数を連結することによって形成されます。ツイートは、ポジティブ、ニュートラル、またはネガティブとして分類されます。分類器のパフォーマンスは、精度、精度、リコール、およびF1スコアで評価されます。完全性のために、ディープラーニングモデルの長い短期メモリ(LSTM)アーキテクチャを使用して、データセットでさらなる調査が行われます。結果は、提案された連結機能セットを使用して0.93の精度スコアを達成することにより、余分な木分類器が他のすべてのモデルを上回ることを示しています。LSTMは、機械学習分類器と比較して低精度を達成します。提案された機能セットの有効性を実証するために、結果は、グローブ機能抽出アプローチに基づいたベイダーセンチメント分析手法と比較されます。
Covid-19の広がりは、世界的な健康上の懸念をもたらしました。ソーシャルメディアは、それに関するニュースや意見を共有するためにますます使用されています。リソースを最適かつ適切に利用するには、状況の現実的な評価が必要です。この研究では、監視された機械学習アプローチを使用して、Covid-19 Tweetsセンチメント分析を実行します。ツイートからのCovid-19感情の特定は、現在のパンデミックの状況をより適切に処理するための情報に基づいた決定を可能にするでしょう。使用されているデータセットは、IEEEデータポートで提供されているIDを使用してTwitterから抽出されます。ツイートは、Tweepy Libraryを使用する社内で構築されたCrawlerによって抽出されます。データセットは、前処理技術を使用してクリーニングされ、TextBlobライブラリを使用して感情が抽出されます。この作業の貢献は、提案された機能セットを使用したさまざまな機械学習分類器のパフォーマンス評価です。このセットは、単語の袋と周波数逆のドキュメント周波数を連結することによって形成されます。ツイートは、ポジティブ、ニュートラル、またはネガティブとして分類されます。分類器のパフォーマンスは、精度、精度、リコール、およびF1スコアで評価されます。完全性のために、ディープラーニングモデルの長い短期メモリ(LSTM)アーキテクチャを使用して、データセットでさらなる調査が行われます。結果は、提案された連結機能セットを使用して0.93の精度スコアを達成することにより、余分な木分類器が他のすべてのモデルを上回ることを示しています。LSTMは、機械学習分類器と比較して低精度を達成します。提案された機能セットの有効性を実証するために、結果は、グローブ機能抽出アプローチに基づいたベイダーセンチメント分析手法と比較されます。
The spread of Covid-19 has resulted in worldwide health concerns. Social media is increasingly used to share news and opinions about it. A realistic assessment of the situation is necessary to utilize resources optimally and appropriately. In this research, we perform Covid-19 tweets sentiment analysis using a supervised machine learning approach. Identification of Covid-19 sentiments from tweets would allow informed decisions for better handling the current pandemic situation. The used dataset is extracted from Twitter using IDs as provided by the IEEE data port. Tweets are extracted by an in-house built crawler that uses the Tweepy library. The dataset is cleaned using the preprocessing techniques and sentiments are extracted using the TextBlob library. The contribution of this work is the performance evaluation of various machine learning classifiers using our proposed feature set. This set is formed by concatenating the bag-of-words and the term frequency-inverse document frequency. Tweets are classified as positive, neutral, or negative. Performance of classifiers is evaluated on the accuracy, precision, recall, and F1 score. For completeness, further investigation is made on the dataset using the Long Short-Term Memory (LSTM) architecture of the deep learning model. The results show that Extra Trees Classifiers outperform all other models by achieving a 0.93 accuracy score using our proposed concatenated features set. The LSTM achieves low accuracy as compared to machine learning classifiers. To demonstrate the effectiveness of our proposed feature set, the results are compared with the Vader sentiment analysis technique based on the GloVe feature extraction approach.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。