Laboratory work #3, Vladislava Tsvetkova - 22FPL2 #165

Vladays · 2023-11-23T23:04:07Z

No description provided.

artyomtugaryov · 2023-11-30T13:42:37Z

lab_3_generate_by_ngrams/main.py

@@ -26,7 +24,7 @@ def __init__(self, end_of_word_token: str) -> None:
            end_of_word_token (str): A token denoting word boundary
        """
        self._end_of_word_token = end_of_word_token
-        self._storage = {end_of_word_token: 0}
+        self._storage = {'_': 0}


What '_' is ?

artyomtugaryov · 2023-11-30T13:43:23Z

lab_3_generate_by_ngrams/main.py

-            return token[0]
-
-        return None
+        return self._storage[element]


are you sure?

artyomtugaryov · 2023-11-30T13:43:58Z

lab_3_generate_by_ngrams/main.py

+            for token in element:
+                if token.isalpha():
+                    self._put(token)
+                if token in (' ', self._end_of_word_token):


you create it on each iteratiuon. Why?

Create it once before loop

artyomtugaryov · 2023-11-30T13:44:13Z

lab_3_generate_by_ngrams/target_score.txt

@@ -1 +1 @@
-10
+0


lab_3_generate_by_ngrams/main.py

artyomtugaryov · 2023-12-07T13:21:53Z

lab_3_generate_by_ngrams/main.py

@@ -105,13 +104,9 @@ def get_token(self, element_id: int) -> Optional[str]:
        """
        if not isinstance(element_id, int):
            return None
+        if element_id not in self._storage.values()):
+            return None


where is the imlementation?

You removed it. Right now only checks are on the function

it's here now

artyomtugaryov · 2023-12-07T13:22:50Z

lab_3_generate_by_ngrams/start.py

-    print(greedy_text_generator.run(51, 'Vernon'))
+    n_gram_language_model = NGramLanguageModel(encoded[:100], 7)
+    print(n_gram_language_model.build())
+    greedy_text_generator = GreedyTextGenerator(n_gram_language_model, text_processor)


add build, please

artyomtugaryov · 2023-12-14T07:02:52Z

lab_3_generate_by_ngrams/main.py

+            for token in element:
+                if token.isalpha():
+                    self._put(token)
+                if token in (' ', self._end_of_word_token):


Create it once before loop

artyomtugaryov · 2023-12-14T07:09:35Z

lab_3_generate_by_ngrams/main.py

@@ -272,6 +260,7 @@ class NGramLanguageModel:
        _encoded_corpus (tuple): Encoded text
    """

+


artyomtugaryov · 2023-12-14T07:12:06Z

lab_3_generate_by_ngrams/main.py

-            max_freq_tokens = [token for token, freq in tokens.items() if freq == max_freq]
-            max_freq_tokens = sorted(max_freq_tokens, reverse=True)
-            encoded_prompt += (max_freq_tokens[0],)
+            best_predictions = [token for token, freq in next_tokens.items() if freq == max(next_tokens.values())]


You can calculate max only once, not in the loop

artyomtugaryov · 2023-12-17T06:11:22Z

lab_3_generate_by_ngrams/main.py

@@ -105,13 +104,9 @@ def get_token(self, element_id: int) -> Optional[str]:
        """
        if not isinstance(element_id, int):
            return None
+        if element_id not in self._storage.values()):
+            return None


You removed it. Right now only checks are on the function

artyomtugaryov · 2023-12-17T06:12:34Z

lab_3_generate_by_ngrams/main.py

-
+        for n_gram in set(n_grams):
+            number_of_n_grams = n_grams.count(n_gram)
+            context_count = len([context for context in n_grams


use Count

Vladays and others added 30 commits September 15, 2023 11:03

lab

55d8e52

Merge remote-tracking branch 'origin/main'

799fac5

Merge branch 'fipl-hse:main' into main

d5d39af

Merge branch 'fipl-hse:main' into main

493fa5c

Merge branch 'fipl-hse:main' into main

2419c59

Merge remote-tracking branch 'origin/main'

8ebc12d

Merge remote-tracking branch 'origin/main'

56d546b

Merge branch 'fipl-hse:main' into main

493007c

Merge branch 'fipl-hse:main' into main

75802c0

Merge remote-tracking branch 'origin/main' into HEAD

8a2df4f

checkout labs from the origin repository

acc8c47

Merge remote-tracking branch 'origin/main'

33edde1

Merge remote-tracking branch 'origin/main'

6a614c0

Merge remote-tracking branch 'origin/main'

cfdd2b7

Merge remote-tracking branch 'origin/main'

ac27676

Merge remote-tracking branch 'origin/main'

a0494c9

Merge remote-tracking branch 'origin/main'

19bc8d1

Merge remote-tracking branch 'origin/main'

a603311

Merge remote-tracking branch 'origin/main'

e8b7b1b

Merge branch 'fipl-hse:main' into main

2bfa136

Merge remote-tracking branch 'origin/main'

c716d03

Merge remote-tracking branch 'origin/main'

e0becf6

Merge remote-tracking branch 'origin/main'

1a4b880

Delete seminars/practice_2_string.py

3225a38

Merge remote-tracking branch 'origin/main'

3f7cb46

Merge remote-tracking branch 'origin/main'

64b638b

Merge remote-tracking branch 'origin/main'

5e714b8

Merge remote-tracking branch 'origin/main'

f36d15d

Merge remote-tracking branch 'origin/main'

017805a

Merge remote-tracking branch 'origin/main'

81a1145

Merge remote-tracking branch 'origin/main'

c432720

vitazaytseva added the Missed deadline label Nov 24, 2023

artyomtugaryov added 2 commits November 30, 2023 15:48

Merge remote-tracking branch 'origin/main' into HEAD

a82eca8

checkout labs from the origin repository

4ce4cac

artyomtugaryov suggested changes Nov 30, 2023

View reviewed changes

artyomtugaryov added the Changes required label Nov 30, 2023

Vladays and others added 9 commits November 30, 2023 21:26

Merge remote-tracking branch 'origin/main'

642295b

Merge remote-tracking branch 'origin/main'

0c06e29

Merge remote-tracking branch 'origin/main'

928e597

Merge remote-tracking branch 'origin/main'

891c718

Merge branch 'fipl-hse:main' into main

c0ee102

Merge remote-tracking branch 'origin/main'

4e362b1

Merge remote-tracking branch 'origin/main'

a6d2ecd

@checkout@

41eb3cc

Merge with main

80c2971

artyomtugaryov suggested changes Dec 7, 2023

View reviewed changes

artyomtugaryov suggested changes Dec 14, 2023

View reviewed changes

artyomtugaryov suggested changes Dec 17, 2023

View reviewed changes

Vladays added 10 commits December 18, 2023 12:50

Merge remote-tracking branch 'origin/main'

ffb29fa

Merge remote-tracking branch 'origin/main'

7e0a39a

Merge remote-tracking branch 'origin/main'

cff351d

Merge remote-tracking branch 'origin/main'

3e2b216

Merge remote-tracking branch 'origin/main'

264c97b

Merge remote-tracking branch 'origin/main'

cf71930

Merge remote-tracking branch 'origin/main'

c611f7d

Merge remote-tracking branch 'origin/main'

f5e5ce4

Merge remote-tracking branch 'origin/main'

4294120

Merge remote-tracking branch 'origin/main'

7969560

vitazaytseva added the Done label Dec 19, 2023

vitazaytseva closed this Dec 19, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Laboratory work #3, Vladislava Tsvetkova - 22FPL2 #165

Laboratory work #3, Vladislava Tsvetkova - 22FPL2 #165

Vladays commented Nov 23, 2023

artyomtugaryov Nov 30, 2023

artyomtugaryov Nov 30, 2023

artyomtugaryov Nov 30, 2023

artyomtugaryov Dec 14, 2023

artyomtugaryov Nov 30, 2023

Vladays Nov 30, 2023

artyomtugaryov Dec 7, 2023

artyomtugaryov Dec 17, 2023

Vladays Dec 18, 2023

artyomtugaryov Dec 7, 2023

artyomtugaryov Dec 14, 2023

artyomtugaryov Dec 14, 2023

artyomtugaryov Dec 14, 2023

artyomtugaryov Dec 17, 2023

artyomtugaryov Dec 17, 2023

		@@ -272,6 +260,7 @@ class NGramLanguageModel:
		_encoded_corpus (tuple): Encoded text
		"""

Laboratory work #3, Vladislava Tsvetkova - 22FPL2 #165

Laboratory work #3, Vladislava Tsvetkova - 22FPL2 #165

Conversation

Vladays commented Nov 23, 2023

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment