하는 방법이트에서 MongoDB

0

질문

할 수 있는 사람이 추천한 방법으로 할 수 있는 이론적으로 MongoDB query?

import pandas as pd 
data = pd.read_csv("elonmusk.csv") 
from collections import Counter
Counter(" ".join(data["tweet"]).split()).most_common(100)

내가 찾는 데 도움을 쓰 MongoDB 쿼리를 만들 수 있는 비슷한 출력으로 Python 코드가 여기에 표시됩니다.

분석하는 모든 텍스트의 한 분야로 돌아 가장 일반적인 단어입니다.

enter image description here

믿 MongoDB 단어 구름 링크를 여기에는 유사 솔루션 https://docs.mongodb.com/charts/saas/chart-type-reference/word-cloud/ 그러나 내가 쓰는 코드에서 MongoDB 쉘입니다.

나는 확실하지 않았을 적용하는 방법은 다음과 같은 유래한 솔루션이 링크에서 가장 자주 말씀에서 MongoDB 컬렉션

사전에 감사를 위해 모든 조언입니다.

mongodb
2021-11-24 00:08:23
1

최고의 응답

1

쿼리

  • 쿼리에서는 텍스트에는 트윗 분야
  • 치를 찾을 단어는 regex(단어 알파벳과 숫자만 포함 여기)
  • 그룹 계산
  • $set 수정하는 구조물(사용할 수 있는 프로젝트도 같은)
  • 종류에 의해 단어 개수
  • 제한을 유지하는 100 가장 인기있는 단어

테스트 코드기

aggregate(
[{"$match": {"$expr": {"$eq": [{"$type": "$tweet"}, "string"]}}},
 {"$set": 
    {"matches": {"$regexFindAll": {"input": "$tweet", "regex": "\\w+"}}}},
 {"$project": {"tokens": "$matches.match"}},
 {"$unwind": {"path": "$tokens"}},
 {"$group": {"_id": "$tokens", "count": {"$sum": 1}}},
 {"$set": {"word": "$_id", "_id": "$$REMOVE"}},
 {"$sort": {"count": -1}},
 {"$limit": 100}])
2021-12-12 14:34:04

안녕 Takis_ 정말 감사 솔루션입니다. 나는 몇 가지 문제에 노력하고 그것을 실행합니다. 처음 제가 오류가 있습니다..... 집계 정의하지 않은,그래서 나는 추가의 컬렉션 이름기 전에 당신의 코드입니다. db.트윗입니다.집계(지금 제가 이 오류가 있습니다.... $regexFindAll 필요를 입력하의 형식 문자열"이 설정 트윗 필드를 텍스트 인덱스이지만 내가 떨어졌다는 인덱스와 나는 아직도 오류$regexFindAll 필요를 입력하의 형식 문자열"그래서 나는 선택이 무엇을 입력 필드:typeof db.Tweet.findone().트윗을 반환하는 문자열을 어떤 방법이 있나요?
Christopher

일부는 문서(s)이 없는 문자열 트윗,이은 문제가되지 않습니다, $match 을 유지할 수 있습만 있는 문서로 트윗의 문자열입니다. 업데이트 했 대답이다.
Takis _

완벽하게 작동하는 Takis,난 그냥을 하나로 만들은 작은 편집하는 그것을 얻을 작동하는 쉘에서는 접두어 코드가 db. 고의 컬렉션 이름 트윗입니다.
Christopher

db.트윗입니다.집계([{"$match":{"$expr":{"$eq":[{"type":"$트윗"},"문자열"]}}},{"$설정":{"는":{"$regexFindAll":{"입력":"$트윗","regex":"\\w+"}}}}, {"$프로젝트는":{"토큰":"$일치합니다.경기"}},{"$션":{"path":"$토큰"}},{"$그룹":{"용할 수 있게 될 것이":"$토큰","count":{"$sum": 1}}}, {"$설정":{"단어":"$그리고 우리가","용할 수 있게 될 것이":"$$제거"}},{"$종류":{"count":-1}}, {"$제한":100}])
Christopher

다른 언어로

이 페이지는 다른 언어로되어 있습니다

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................