著名医師による解説が無料で読めます
すると翻訳の精度が向上します
ソーシャルメディアで共有されるコンテンツの膨大な量と多様性は、潜在的な顧客を特定するためにそれを使用したいビジネスに課題となる可能性があります。この論文では、私たちの目的は、最小限の注釈の取り組みを備えたTwitterでのターゲットオーディエンス分類のための監視されていない学習方法と監督された学習方法の両方の使用を調査することです。トピックドメインは、TwitterのLatent Dirichlet割り当て(LDA)を使用して、アカウント所有者のフォロワーが共有するコンテンツから自動的に発見されました。次に、サポートベクターマシン(SVM)アンサンブルを、Twitter LDAによって識別されたさまざまなトピックドメインの異なるアカウント所有者のコンテンツを使用してトレーニングされました。実験結果は、提示された方法がターゲットオーディエンスを高い精度で正常に識別できることを示しています。さらに、トレーニングデータセットを構築するためにランダムサンプリングを使用する代わりに、サンプリングオーバーサンプリングでのブートストラップなどの統計的推論アプローチを使用すると、SVMアンサンブルでより良い分類器を実現できることを示しています。このようなアンサンブルシステムは、データの多様性を活用できるため、将来の顧客を一般的な視聴者と区別するための現実世界のアプリケーションが可能になり、混雑したソーシャルメディア分野でのビジネス優位性につながると結論付けています。
ソーシャルメディアで共有されるコンテンツの膨大な量と多様性は、潜在的な顧客を特定するためにそれを使用したいビジネスに課題となる可能性があります。この論文では、私たちの目的は、最小限の注釈の取り組みを備えたTwitterでのターゲットオーディエンス分類のための監視されていない学習方法と監督された学習方法の両方の使用を調査することです。トピックドメインは、TwitterのLatent Dirichlet割り当て(LDA)を使用して、アカウント所有者のフォロワーが共有するコンテンツから自動的に発見されました。次に、サポートベクターマシン(SVM)アンサンブルを、Twitter LDAによって識別されたさまざまなトピックドメインの異なるアカウント所有者のコンテンツを使用してトレーニングされました。実験結果は、提示された方法がターゲットオーディエンスを高い精度で正常に識別できることを示しています。さらに、トレーニングデータセットを構築するためにランダムサンプリングを使用する代わりに、サンプリングオーバーサンプリングでのブートストラップなどの統計的推論アプローチを使用すると、SVMアンサンブルでより良い分類器を実現できることを示しています。このようなアンサンブルシステムは、データの多様性を活用できるため、将来の顧客を一般的な視聴者と区別するための現実世界のアプリケーションが可能になり、混雑したソーシャルメディア分野でのビジネス優位性につながると結論付けています。
The vast amount and diversity of the content shared on social media can pose a challenge for any business wanting to use it to identify potential customers. In this paper, our aim is to investigate the use of both unsupervised and supervised learning methods for target audience classification on Twitter with minimal annotation efforts. Topic domains were automatically discovered from contents shared by followers of an account owner using Twitter Latent Dirichlet Allocation (LDA). A Support Vector Machine (SVM) ensemble was then trained using contents from different account owners of the various topic domains identified by Twitter LDA. Experimental results show that the methods presented are able to successfully identify a target audience with high accuracy. In addition, we show that using a statistical inference approach such as bootstrapping in over-sampling, instead of using random sampling, to construct training datasets can achieve a better classifier in an SVM ensemble. We conclude that such an ensemble system can take advantage of data diversity, which enables real-world applications for differentiating prospective customers from the general audience, leading to business advantage in the crowded social media space.
医師のための臨床サポートサービス
ヒポクラ x マイナビのご紹介
無料会員登録していただくと、さらに便利で効率的な検索が可能になります。