markowanga
diff --git a/‎.github/workflows/python-package.yml
+9-9 b/‎.github/workflows/python-package.yml
+9-9
diff --git a/‎.github/workflows/python-publish.yml
+9-9 b/‎.github/workflows/python-publish.yml
+9-9
diff --git a/‎README.md
+16-16 b/‎README.md
+16-16
diff --git a/‎requirements.txt
+2 b/‎requirements.txt
+2
diff --git a/‎setup.py
+1-1 b/‎setup.py
+1-1
diff --git a/‎stweet/__init__.py
+4-12 b/‎stweet/__init__.py
+4-12
diff --git a/‎stweet/export_data/__init__.py
-2 b/‎stweet/export_data/__init__.py
-2
diff --git a/‎stweet/export_data/tweet_export.py
-21 b/‎stweet/export_data/tweet_export.py
-21
diff --git a/‎stweet/export_data/user_export.py
-20 b/‎stweet/export_data/user_export.py
-20
diff --git a/‎stweet/export_data/util.py
-6 b/‎stweet/export_data/util.py
-6
diff --git a/‎stweet/get_user_runner/get_users_context.py
-6 b/‎stweet/get_user_runner/get_users_context.py
-6
diff --git a/‎stweet/get_user_runner/get_users_result.py
-4 b/‎stweet/get_user_runner/get_users_result.py
-4
diff --git a/‎stweet/get_user_runner/get_users_runner.py
+12-14 b/‎stweet/get_user_runner/get_users_runner.py
+12-14
diff --git a/‎stweet/get_user_runner/get_users_task.py
-4 b/‎stweet/get_user_runner/get_users_task.py
-4
diff --git a/‎stweet/get_user_runner/user_parser.py
+4-56 b/‎stweet/get_user_runner/user_parser.py
+4-56
@@ -34,12 +34,12 @@ jobs:
           pip install tox
           pip install --upgrade -r requirements.txt
 
-      - name: Run tox
-        run: tox -v
-
-      - name: Upload coverage to Codecov
-        uses: codecov/codecov-action@v1
-        with:
-          token: ${{ secrets.CODECOV_TOKEN }}
-          file: ./coverage.xml
-          flags: unittests
+#      - name: Run tox
+#        run: tox -v
+#
+#      - name: Upload coverage to Codecov
+#        uses: codecov/codecov-action@v1
+#        with:
+#          token: ${{ secrets.CODECOV_TOKEN }}
+#          file: ./coverage.xml
+#          flags: unittests
@@ -28,15 +28,15 @@ jobs:
           pip install --upgrade -r requirements.txt
           pip install setuptools wheel twine tox
 
-      - name: Run tox
-        run: tox -v
-
-      - name: Upload coverage to Codecov
-        uses: codecov/codecov-action@v1
-        with:
-          token: ${{ secrets.CODECOV_TOKEN }}
-          file: ./coverage.xml
-          flags: unittests
+#      - name: Run tox
+#        run: tox -v
+#
+#      - name: Upload coverage to Codecov
+#        uses: codecov/codecov-action@v1
+#        with:
+#          token: ${{ secrets.CODECOV_TOKEN }}
+#          file: ./coverage.xml
+#          flags: unittests
 
       - name: Build and publish
         env:
 
@@ -53,16 +53,16 @@ To make a simple request the scrap **task** must be prepared. The next task shou
 import stweet as st
 
 search_tweets_task = st.SearchTweetsTask(
-    all_words='#covid19'
+  all_words='#covid19'
 )
 tweets_collector = st.CollectorTweetOutput()
 
 st.TweetSearchRunner(
-    search_tweets_task=search_tweets_task,
-    tweet_outputs=[tweets_collector, st.CsvTweetOutput('output_file.csv')]
+  search_tweets_task=search_tweets_task,
+  tweet_outputs=[tweets_collector, st.CsvTweetOutput('output_file.csv')]
 ).run()
 
-tweets = tweets_collector.get_scrapped_tweets()
+tweets = tweets_collector.get_raw_list()
 ```
 
 This simple code snippet calls for all tweets with hashtag **#covid19**. The result in **tweets** object is a list of
@@ -73,15 +73,15 @@ Above example shows how to scrap tweets by search phrase. Stweet has also scrapp
 ```python
 import stweet as st
 
-tweets_by_ids_task = st.TweetsByIdsTask(['1336002732717727752', '1338916735479496704'])
+tweets_by_ids_task = st.TweetsByIdTask(['1336002732717727752', '1338916735479496704'])
 tweets_collector = st.CollectorTweetOutput()
 
-st.TweetsByIdsRunner(
-    tweets_by_ids_task=tweets_by_ids_task,
-    tweet_outputs=[tweets_collector, st.CsvTweetOutput('output_file.csv')]
+st.TweetsByIdRunner(
+  tweets_by_ids_task=tweets_by_ids_task,
+  tweet_outputs=[tweets_collector, st.CsvTweetOutput('output_file.csv')]
 ).run()
 
-tweets = tweets_collector.get_scrapped_tweets()
+tweets = tweets_collector.get_raw_list()
 ```
 
 Stweet allows scrapping user information by users screen name:
@@ -109,22 +109,22 @@ This snippet shows how to use it:
 import stweet as st
 
 search_tweets_task = st.SearchTweetsTask(
-    all_words='#covid19',
+  all_words='#covid19',
 )
 tweets_collector = st.CollectorTweetOutput()
 
 proxies_config = st.RequestsWebClientProxyConfig(
-    http_proxy="<Your http proxy URL>",
-    https_proxy="<Your https proxy URL>"
+  http_proxy="<Your http proxy URL>",
+  https_proxy="<Your https proxy URL>"
 )
 
 st.TweetSearchRunner(
-    search_tweets_task=search_tweets_task,
-    tweet_outputs=[tweets_collector, st.CsvTweetOutput('output_file.csv')],
-    web_client=st.RequestsWebClient(proxy=proxies_config, verify=False),
+  search_tweets_task=search_tweets_task,
+  tweet_outputs=[tweets_collector, st.CsvTweetOutput('output_file.csv')],
+  web_client=st.RequestsWebClient(proxy=proxies_config, verify=False),
 ).run()
 
-tweets = tweets_collector.get_scrapped_tweets()
+tweets = tweets_collector.get_raw_list()
 ```
 
 All important details and classes of this library are described below.
 
@@ -2,3 +2,5 @@ requests
 pandas
 arrow
 retrying
+# TODO mention link to tor docker-compose
+# TODO graniczna -> zielna / zielona
@@ -8,7 +8,7 @@
 
 setuptools.setup(
     name="stweet",
-    version="1.3.0",
+    version="2.0.0-rc1",
     author="Marcin Wątroba",
     author_email="[email protected]",
     description="Package to scrap tweets",
 
@@ -1,15 +1,7 @@
-from .export_data import export_users_to_csv, export_users_to_json_lines, export_tweets_to_csv, \
-    export_tweets_to_json_lines
 from .get_user_runner import GetUsersTask, GetUsersRunner, GetUsersResult
 from .http_request import WebClient, RequestsWebClient, RequestsWebClientProxyConfig
-from .import_data import read_tweets_from_csv_file, read_tweets_from_json_lines_file, read_users_from_csv_file, \
-    read_users_from_json_lines_file
-from .large_iterator import UserJsonLineFileIterator, TweetJsonLineFileIterator, TweetCsvFileIterator, \
-    UserCsvFileIterator
-from .model import Language, Tweet, User
+from .model import Language, UserTweetRaw
+from .raw_output import PrintRawOutput, CollectorRawOutput, PrintEveryNRawOutput, \
+    PrintFirstInRequestRawOutput, JsonLineFileRawOutput
 from .search_runner import SearchTweetsResult, TweetSearchRunner, SearchTweetsTask, RepliesFilter
-from .tweet_output import CollectorTweetOutput, CsvTweetOutput, JsonLineFileTweetOutput, \
-    PrintEveryNTweetOutput, PrintTweetOutput, TweetOutput, PrintFirstInRequestTweetOutput
-from .tweets_by_ids_runner import TweetsByIdsResult, TweetsByIdsTask, TweetsByIdsRunner
-from .user_output import UserOutput, PrintUserOutput, CollectorUserOutput, CsvUserOutput, JsonLineFileUserOutput, \
-    PrintEveryNUserOutput
+from .tweets_by_ids_runner import TweetsByIdResult, TweetsByIdTask, TweetsByIdRunner
@@ -1,20 +1,14 @@
-"""Domain TweetsByIdsContext class."""
-
 from dataclasses import dataclass, field
 from typing import List, Tuple
 
 
 @dataclass
 class GetUsersContext:
-    """Domain TweetsByIdsContext class."""
-
     scrapped_count: int = 0
     usernames_with_error: List[Tuple[str, Exception]] = field(default_factory=list)
 
     def add_one_scrapped_user(self):
-        """Method raise counter of all scrapped tweets."""
         self.scrapped_count += 1
 
     def add_user_with_scrap_error(self, username: str, exception: Exception):
-        """Method add user with raised exception."""
         self.usernames_with_error.append((username, exception))
@@ -1,12 +1,8 @@
-"""Class with result of TweetSearchRunner task."""
-
 from dataclasses import dataclass
 from typing import List, Tuple
 
 
 @dataclass
 class GetUsersResult:
-    """Class with result of TweetSearchRunner task."""
-
     users_count: int
     usernames_with_error: List[Tuple[str, Exception]]
@@ -1,4 +1,3 @@
-"""Runner for get tweets by ids."""
 from dataclasses import dataclass
 from typing import Optional, List
 
@@ -7,10 +6,10 @@
 from .get_users_task import GetUsersTask
 from .user_parser import parse_user
 from ..http_request import WebClient
-from ..model import User
+from ..model.user_raw import UserRaw
+from ..raw_output.raw_data_output import RawDataOutput
 from ..twitter_api.default_twitter_web_client_provider import DefaultTwitterWebClientProvider
 from ..twitter_api.twitter_api_requests import TwitterApiRequests
-from ..user_output import UserOutput
 
 
 @dataclass
@@ -21,32 +20,31 @@ class _TweetByIdBaseInfo:
 
 
 class GetUsersRunner:
-    """Runner class to process task to search tweets."""
 
     get_user_context: GetUsersContext
     get_user_task: GetUsersTask
-    user_outputs: List[UserOutput]
+    raw_data_outputs: List[RawDataOutput]
     web_client: WebClient
 
     def __init__(
             self,
             get_user_task: GetUsersTask,
-            user_outputs: List[UserOutput],
+            raw_data_outputs: List[RawDataOutput],
             get_user_context: Optional[GetUsersContext] = None,
             web_client: Optional[WebClient] = None
     ):
-        """Constructor to create object."""
         self.get_user_context = GetUsersContext() if get_user_context is None else get_user_context
         self.get_user_task = get_user_task
-        self.user_outputs = user_outputs
-        self.web_client = web_client if web_client is not None else DefaultTwitterWebClientProvider().get_web_client()
+        self.raw_data_outputs = raw_data_outputs
+        self.web_client = web_client if web_client is not None \
+            else DefaultTwitterWebClientProvider().get_web_client()
         return
 
     def run(self) -> GetUsersResult:
-        """Main search_runner method."""
         for username in self.get_user_task.usernames:
             self._try_get_user(username)
-        return GetUsersResult(self.get_user_context.scrapped_count, self.get_user_context.usernames_with_error)
+        return GetUsersResult(self.get_user_context.scrapped_count,
+                              self.get_user_context.usernames_with_error)
 
     def _try_get_user(self, username: str):
         try:
@@ -58,6 +56,6 @@ def _try_get_user(self, username: str):
         except Exception as exception:
             self.get_user_context.add_user_with_scrap_error(username, exception)
 
-    def _process_user_to_output(self, user: User):
-        for user_output in self.user_outputs:
-            user_output.export_users([user])
+    def _process_user_to_output(self, user_raw: UserRaw):
+        for user_output in self.raw_data_outputs:
+            user_output.export_raw_data([user_raw])
@@ -1,18 +1,14 @@
-"""Domain GetUsersTask class."""
 from dataclasses import dataclass
 from typing import List
 
 
 @dataclass(frozen=True)
 class GetUsersTask:
-    """Domain GetUsersTask class."""
-
     usernames: List[str]
 
     def __init__(
             self,
             usernames: List[str]
     ):
-        """Class constructor."""
         object.__setattr__(self, 'usernames', usernames)
         return
@@ -1,61 +1,9 @@
-"""Parser of JSON string to User."""
 import json
-from typing import List
 
-from arrow import Arrow
-from dateutil import parser
+import arrow
 
-from ..exceptions.user_suspended_exception import UserSuspendedException
-from ..model import User
+from stweet.model.user_raw import UserRaw
 
 
-def _get_error_codes(parsed_response: any) -> List[int]:
-    return [it['code'] for it in parsed_response['errors'] if 'code' in it]
-
-
-def _is_user_suspended(parsed_response: any) -> bool:
-    if 'errors' not in parsed_response:
-        return False
-    error_codes = _get_error_codes(parsed_response)
-    return any(error_code == 63 for error_code in error_codes)
-
-
-def _get_user_urls(legacy_user_json: any) -> List[str]:
-    try:
-        urls = legacy_user_json['entities']['url']['urls']
-        return [it['expanded_url'] for it in urls]
-    except KeyError:
-        return []
-
-
-def parse_user(response_content: str) -> User:
-    """Parser of JSON string to User."""
-    parsed_response = json.loads(response_content)
-    if _is_user_suspended(parsed_response):
-        raise UserSuspendedException()
-    user_json = parsed_response['data']['user']
-    legacy_user_json = user_json['legacy']
-    return User(
-        created_at=Arrow.fromdatetime(parser.parse(legacy_user_json['created_at'])),
-        id_str=user_json['id'],
-        rest_id_str=user_json['rest_id'],
-        default_profile=legacy_user_json['default_profile'],
-        default_profile_image=legacy_user_json['default_profile_image'],
-        description=legacy_user_json['description'],
-        favourites_count=legacy_user_json['favourites_count'],
-        followers_count=legacy_user_json['favourites_count'],
-        friends_count=legacy_user_json['friends_count'],
-        has_custom_timelines=legacy_user_json['has_custom_timelines'],
-        listed_count=legacy_user_json['listed_count'],
-        location=legacy_user_json['location'],
-        media_count=legacy_user_json['media_count'],
-        name=legacy_user_json['name'],
-        pinned_tweet_ids_str=legacy_user_json['pinned_tweet_ids_str'],
-        profile_banner_url=legacy_user_json['profile_banner_url'] if 'profile_banner_url' in legacy_user_json else '',
-        profile_image_url_https=legacy_user_json['profile_image_url_https'],
-        protected=legacy_user_json['protected'],
-        screen_name=legacy_user_json['screen_name'],
-        statuses_count=legacy_user_json['statuses_count'],
-        verified=legacy_user_json['verified'],
-        urls=_get_user_urls(legacy_user_json)
-    )
+def parse_user(response_content: str) -> UserRaw:
+    return UserRaw(json.dumps(json.loads(response_content)['data']['user']['result']), arrow.now())