Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
 
Рейтинг 5.00/5: Рейтинг темы: голосов - 5, средняя оценка - 5.00
383 / 23 / 2
Регистрация: 12.06.2021
Сообщений: 211
Записей в блоге: 2

Как удалить дубликаты повторяющихся ID в файле и пересохранить?

22.11.2023, 19:39. Показов 1327. Ответов 20
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Решила попробовать распарсить группу вконтакте. Нашла информацию как это сделать. Есть вполне рабочий вариант.
https://qna.habr.com/q/1282990
Python
1
2
3
4
5
6
7
8
9
10
11
12
count = m['members_count']
 
for i in range(0,count+1,1000):
    response_for_getMembers = requests.get('https://api.vk.com/method/groups.getMembers',
                            params={
                                'access_token':token,
                                'v': version,
                                'group_id': group_id,
                                'count': 1000,
                                'offset': i
    })
    members_list.extend(“формируем массив”)
Параметр count = m['members_count']
Это количество участников в группе. В итоге как бы я не парсила, если даже так прописать “for i in range(0,count,1000) (без единицы в count)” всегда создаются дубликаты. Количество дубликатов 1000 это я проверила функцией на JS.
JavaScript
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
async function LoadFromFile(FileName)
     {
         let contentResponse = await fetch(FileName);
        
         let text = await contentResponse.json();
         
        
         var totalRemoved = 0;
         var removed = { };
         var result = [];
         
         var myArray = text;
         
          for (var i = 0; i < myArray.length; i++) {
                if (result.indexOf(myArray[i]) < 0) {
                    result.push(myArray[i]);
                    continue;
                }
               
                removed[myArray[i]] == undefined?removed[myArray[i]] = 1:removed[myArray[i]]++;
                totalRemoved++;
            }
            
          console.log("Всего удалено " + totalRemoved + " элемента:");
          for (var j in removed) console.log(j + " - " + removed[j]);
          console.log("Исходный массив перед очисткой:\r\n", myArray);
          console.log("Исходный массив после очистки:\r\n", result);
         
     }
 
 
 
$(document).on('click','#id1', function(event){
  LoadFromFile("file.txt");
});
На JavaScript я знаю как написать, а вот как это сделать на Python, т.е. почистить файл от дубликатов ID и сохранить, например.
Python
1
2
3
 with open('file.txt', 'w') as fw:
          # записываем
          json.dump(members_list, fw)
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
22.11.2023, 19:39
Ответы с готовыми решениями:

Как в текстовом файле удалить все дубликаты?
Дан файл со списком e-mail адресов. Найти дубликаты и привести все адреса к нижнему регистру. Помогите кому не сложно(

Определить число повторяющихся символов в дереве и удалить дубликаты
Помогите, пожалуйста, решить сие: Задание: Построить дерево поиска с элементами – символами. Определить число повторяющихся символов в...

Как удалить дубликаты элементов в XML-файле без помощи LINQ?
как удалить дубликаты элементов XML? ГЛАВНОЕ не при помощи LINQ &lt;aaa test=&quot;bbb&quot;/&gt;&lt;aaa test=&quot;bbb&quot;/&gt;&lt;bbb...

20
383 / 23 / 2
Регистрация: 12.06.2021
Сообщений: 211
Записей в блоге: 2
24.11.2023, 17:47  [ТС]
Студворк — интернет-сервис помощи студентам
Цитата Сообщение от YuS_2 Посмотреть сообщение
исправить что?
Уже не важно, подсчет удаленных элементов можно не добавлять. Сама функция удаление дубликатов вот.

Python
1
2
3
4
5
6
7
8
9
def clear_double_array(myArray):
  result = []
  for i in range(len(myArray)):
    try:
      print(result.index(myArray[i]))
    except:
      result.append(myArray[i]);
      continue
  return result
Вообщем-то можно обойтись и без нее ошибку я нашла. Использовала объединение списков два раза от этого и произошли дубликаты.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
24.11.2023, 17:47
Помогаю со студенческими работами здесь

Удалить дубликаты в файле csv (notepad++)
Здравствуйте! В программе Notepad++ Есть файл csv, он хоть и длинный, но я приведу коротким пример. Нужно удалить дубликаты, но...

Пересохранить файл, указав количество повторяющихся строк
Добрый день! Помогите, пожалуйста, составить программу, которая бы считывала бы текст из файла построчно и если в нем есть повторяющиеся...

Как удалить дубликаты в бд
Есть таблица time в ней поля name и status. в поле name встречаются дубликаты как их можно удалить что бы остались только уникальные поля...

Удаление повторяющихся (дубликаты) значений. VBA
Добрый день Уважаемые форумчане, Хочу спросить у вас помощи, возможно ли каким-либо образом упростить мой код. Что мне нужно...

Как удалить дубликаты из ListBox?
Нужно было написать событие, удаляющее из списка дубликаты. Сижу уже несколько дней непролазно за кодом, может уже очевидного не вижу. ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
21
Ответ Создать тему
Новые блоги и статьи
Символьное дифференцирование
igorrr37 13.02.2026
/ * Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2). Унарный минус обозначается как ! в-строка - входное арифметическое выражение в инфиксной(обычной). . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу, и светлой Луне. В мире покоя нет и люди не могут жить в тишине. А жить им немного лет.
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила» «Время-Деньги» «Деньги -Пуля»
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru