Форум программистов, компьютерный форум, киберфорум
Наши страницы

C# .NET

Войти
Регистрация
Восстановить пароль
 
Рейтинг: Рейтинг темы: голосов - 342, средняя оценка - 4.78
Mikant
1270 / 942 / 56
Регистрация: 08.12.2009
Сообщений: 1,299
#1

Работа со строками. Строковые функции - C#

28.03.2010, 17:41. Просмотров 48526. Ответов 0
Метки нет (Все метки)

Добрый день, коллеги. В этом посте мне хочется рассказать вам про строки в .NET и, что немаловажно, как же оптимизировать код для работы с ними.

В большинстве книг пишут, что при слиянии (конкатенации) строк надо всегда использовать StringBuilder. На практике же видно, что в общем случае простое суммирование двух строк работает намного быстрее. Забегая вперед хочу сказать, что в первом случае львиная доля времени будет затрачена на создание экземпляра класса StringBuilder и весь этот незамысловатый код сработает медленнее.

Вопрос заключается в том, что же действительно происходит при работе со строками? Как следует поступать программисту, чтобы простейшие строковые операции не стали ботлнеком (англ. bottleneck - горлышко бутылки - узкое место программы)?

Тут я приведу некое подобие мануала, по работе со строками, которое, надеюсь, будет одинаково полезно, как новичкам, так и "людям со стажем".

Лучшее описание данной проблемы я нашел в книге Patterns&Practices от Microsoft в главе "Improving Managed Code Performance" (увеличение производительности кода). Тут я приведу свой перевод этого текста.

Для представления строк в среде исполнения .NET используется класс System.String. В связи с неизменяемой природой строк, множественная манипуляция ими может существенно сказаться на производительности приложения в целом. Это значит, что при любом изменении строки в своей программе создается новый экземпляр System.String, старый отбрасывается и в дальнейшем подвергается сборщику мусора. Также стоит отметить, что так как System.String является ссылочным типом, то память под содержимое строки выделяется в управляемой куче, а следовательно для удаления строк необходимо(!) использовать сборку мусора.

Здесь обобщены рекомендации по использованию строк:
- Избегайте неэффективной конкатенации строк
- Используйте + когда Вы знаете количество объединяемых строк
- Используйте StringBuilder, когда количество объединяемых строк неизвестно
- Используйте StringBuilder как накопитель строк
- Используйте метод String.Compare для нечувствительного в регистру сравнения строк

1) Избегайте неэффективной конкатенации строк

Каждый раз при изменении строки создается её новый экземпляр, а старый подвергается сборщику мусора. Таким образом эти множественные выделения памяти являются излишними.

- Если Вы объединяете строковые литералы, то компилятор объединит их на этапе компиляции:
C#
1
2
//'Hello' и 'world' это строковые литералы
String str = "Hello" + "world";
- Если Вы объединяете нелитеральные строки, CLR будет объединять их в процессе выполнения, так что оператор + будет создавать множество строковых объектов в упраляемой куче.
- Используйте StringBuilder, когда Вам требуется комплексная обработка или множественное объединение строк:
C#
1
2
3
4
5
6
7
8
9
10
// использование System.String и '+' для объединения
String str = "текст";
for ( ...выполняется несколько раз... ) {
    str = str + " дополнительный текст ";
}
// использование System.StringBuilder и метода .Append для объединения
StringBuilder strBuilder = new StringBuilder("текст");
for ( ...выполняется несколько раз... ) {
    strBuilder.Append(" дополнительный текст ");
}
2) Используйте + когда Вы знаете количество объединяемых строк

Если Вы знаете количество объединяемых строк, то хотите их объединить за раз, то предпочтительнее использование оператора +.
C#
1
String str = str1 + str2 + str3;
Вообще говоря, для объединения строк в одном выражении требуется только один вызов String.Concat. В результате не будет создано множество временных строк (для хранения результатов промежуточных объединений строк).

Важно! Не используйте оператор + для объединения строк в циклах. Вместо этого используйте StringBuilder

3) Используйте StringBuilder, когда количество объединяемых строк неизвестно

Если Вы не знаете количество объединяемых строк, например тогда, когда объединение происходит в цикле, или Вы строите длинные динамические SQL запросы, то используйте класс StringBuilder как показано ниже
C#
1
2
3
4
for (int i=0; i< Results.Count; i++)
{
  StringBuilder.Append (Results[i]);
}
По умолчанию длина буфера для хранения строк у StringBuilder равна 16. Строки, длина которых меньше начального размера этого буфера хранятся внутри экземпляра StringBuilder.
Начальный размер буфера StringBuilder можно установить при использовании перегруженного конструктора:
C#
1
public StringBuilder (int capacity);
Далее Вы можете продолжать объединять строки без дополнительных выделений памяти до тех пор пока не будет превышен размер буфера. Следовательно, StringBuilder более эффективен, чем String для операций конкатенации. При дальнейшем объединении строк StringBuilder будет при необходимости удваивать размер своего внутреннего буфера.

Так что, если вы начали со стартового размера буфера в 16 байт, то при его переполнении выделится память под новый - размера 32, старая строка будет скопирована из старого буфера в новый, а сам старый буфер уже сможет быть удален сборщиком мусора.

Важно!Лучше всегда указывать размер начального буфера во избежание потери производительности при новых выделениях памяти. Лучшим способом нахождения оптимального значения размера буфера является использование профилировщиков среды CLR

4) Используйте StringBuilder как накопитель строк

Вы можете использовать StringBuilder как накопитель строк или многоразовый буфер. Это поможет избежать затрат на множественное выделение памяти при вызовах присоединений строк.

- Объединение строк. Вы всегда должны использовать следующую конструкцию для объединения строк через StringBuilder
C#
1
2
3
StringBuilder sb;
sb.Append(str1);
sb.Append(str2);
Но, никогда не используйте следующее выражение:
C#
1
sb.Append(str1+str2);
потому что, не требуется создавать отдельную временную переменную для хранения str1 + str2 в процессе их объединения.

- Объединение строк-результатов функций:
C#
1
2
3
4
StringBuilder sb;
sb.Append(f1());
sb.Append(f2()); 
sb.Append(f3());
В предыдущем примере после каждого выполнения функции выделяется память для временной строки-результата, а, следовательно, более предпочтительным оказывается вариант передачи StringBuilder как параметра в сами методы:
C#
1
2
3
void f1(sb,...);
void f2(sb,...);
void f3(sb,...);
Таким образом sb.Append будет вызван уже внутри тела функции и не будет необходимости создавать промежуточные буферы

5) Используйте метод String.Compare для нечувствительного в регистру сравнения строк

Аккуратно посмотрите на то, как Вы производите безразличные к регистру букв операции сравнения строк. Избегайте использования ToLower, так как это приводит к созданию временных объектов как показано в этом примере:
C#
1
2
3
4
5
// Плохой подход. ToLower создает временные строки
String str = "Москва";
String str2 = "МоСкВа";
if (str.ToLower()==str2.ToLower())
  // дальнейший код
Наиболее эффективный способ таких сравнений - использование метода Compare:
C#
1
string.Compare(str,str2,true);
Надеюсь данный обзор поможет Вам писать более производительный код в среде CLR.

Тут не могу не привести еще две языковые конструкции с использованием литерального модификатора в C#. Они не влияют на производительность, но также скорее всего помогут Вам в дальнейшем:

1) @ для объединения литералов:
C#
1
2
3
4
        private string lorem = 
          @"Lorem ipsum cum te nonummy nominavi,
            id eos dico menandri euripidis,
            eam ut populo audiam deserunt.";
- тут не используется раздражающая конструкция
C#
1
2
" + 
"
2) @ для спецсимволов:
C#
1
2
3
        private string path1 = @"C:\Users\Mikant\Documents";
        // вместо
        private string path2 = "C:\\Users\\Mikant\\Documents";
- это также может использоваться для составления регулярных выражений или SQL запросов.

Спасибо за внимание!
90
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
28.03.2010, 17:41
Здравствуйте! Я подобрал для вас темы с ответами на вопрос Работа со строками. Строковые функции (C#):

Работа со строками - C#
Что я делаю не так?( см. ошибку в коде Заодно вопрос - как инициализировать массивы строк типа string words чтобы компилятор не...

Работа со строками. - C#
помогите плз написать на с# программу на строки, со строками раньше не сталкивался...Заранее спс вывести номера строк исходного файла...

Работа со строками - C#
Недавно начал изучать C#... Не могу написать одну задачку... Дана строка, в которой содержится осмысленное текстовое сообщение. Слова...

Работа со строками - C#
Всем привет. Помогите пожалуйста. Есть код..... Нужно сделать так, чтобы строки описанные ниже (они же и есть из файла base.xml)...

работа со строками - C#
В заданном тексте с общепринятой пунктуацией програма должна найти слова, которые начинаются и заканчиваются заданной буквой

работа со строками - C#
как разбить строку &quot;x y z OR x y z&quot; на 2 другие, чтобы в них было тока 'x y z' и 'x y z&quot; соответственно...... и как проверить что в...

0
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
28.03.2010, 17:41
Привет! Вот еще темы с ответами:

Работа со строками - C#
Доброго времени суток! Как выполнить разбитие строки на слова, выбрать самые встречающиеся и затем вывести эти слова с количеством...

Работа со строками в файле - C#
помогите пожалуйста с программкой к примеру имеется простой txt файл с такими данными 0 0 text ...

Работа со строками. Поиск подстроки. - C#
Привет всем. У меня есть файл следующего содержания: Я хочу его отпарсить следующим образом: убрать пустую строку перед...

Какие функции в C# работают со строками - C#
Только начал изучать c# я проходим с дельфи - дайти обьяснение какие функции в c# работают со строками? щас очень важны такие: ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Закрытая тема Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2017, vBulletin Solutions, Inc.
Рейтинг@Mail.ru