English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Строки в R

В языке R строки могут быть представлены двойной или одинарной кавычками

  • В строке с одинарными кавычками могут содержаться двойные кавычки.

  • В строке с одинарными кавычками не могут содержаться одинарные кавычки.

  • В строке с двойными кавычками могут содержаться одинарные кавычки.

  • В строке с двойными кавычками не могут содержаться двойные кавычки.

Ниже приведен пример использования строк:

a <- 'Использование одинарных кавычек'
print(a)
b <- "Использование двойных кавычек"
print(b)
c <- "В строке с двойными кавычками можно содержать одинарные кавычки ('"
print(c)
d <- 'В строке с одинарными кавычками можно содержать двойные кавычки (")
print(d)

Результат выполнения вышеуказанного кода:

[1] "Использование одинарных кавычек"
[1] "Использование двойных кавычек"
[1] "В строке с двойными кавычками можно содержать одинарные кавычки ('}"
[1] "В строке с одинарными кавычками можно содержать двойные кавычки (\"}"

Операции со строками

Давайте рассмотрим некоторые内置ые функции языка R для работы со строками

Функция paste()

Функция paste() используется для соединения строк с использованием указанного разделителя, по умолчанию разделитель это пробел

Формат грамматики:

paste(..., sep = "", collapse = NULL)

Описание параметров:

  • ...: список строк

  • sep: разделитель, по умолчанию это пробел

  • collapse: объединение двух или более строковых объектов на основе соответствия элементов, после соединения строк с использованием collapse определяется, как соединять разделители

a <- "Google"
b <- 'w3codebox'
c <- "Taobao"
print(paste(a, b, c))
print(paste(a, b, c, sep = "-"))
print(paste(letters[1:6], 1:6, sep = "", collapse = "="))
paste(letters[1:6], 1:6, collapse = ".")

Результат выполнения вышеуказанного кода:

[1] "Google w3codebox Taobao"
[1] "Google-w3codebox-Taobao"
[1] "a1=b2=c3=d4=e5=f6"
[1] "a 1.b 2.c 3.d 4.e 5.f 6"

Функция format()

Функция format() используется для форматирования строк, function format() может применяться к строкам или числам.

Формат грамматики:

format(x, digits, nsmall, scientific, width, justify = c("left", "right", "centre", "none"))

Описание параметров:

  • x: ввод для вектора

  • digits: количество знаков, отображаемых

  • nsmall: минимальное количество знаков после запятой

  • scientific: устанавливает научную запись

  • width: через заполнение пробелами в начале показывает минимальную ширину

  • justify: устанавливает положение, показ может быть левым, правым, центральным и т.д.

# Показ 9 знаков, последняя цифра округляется
result <- format(23.123456789, digits = 9)
print(result)
# Использование научной записи
result <- format(c(6, 13.14521), scientific = TRUE)
print(result)
# Минимальное количество знаков после запятой 5, недостающие знаки дополняются 0
result <- format(c(6, 13.14521), nsmall = 5)
print(result)
# Преобразование числа в строку
result <- format(6)
print(result)
# Ширина 6 символов, недостающие симbole добавляются в начале
result <- format(13.7, width = 6)
print(result)
# Левый выравнивание строки
result <- format("w3codebox", width = 9, justify = "l")
print(result)
# Выравнивание по центру
result <- format("w3codebox", width = 10, justify = "c")
print(result)

Результат выполнения вышеуказанного кода:

[1] "23.1234568"
[1] "6.000000e+00" "1.314521e+01"
[1] "23.47000"
[1] "6"
[1] "    13.7 "
[1] "w3codebox    "
[1] "    w3codebox    "

Функция nchar()

Функция nchar() используется для расчета длины строки или списка чисел.

Формат грамматики:

nchar(x)

Описание параметров:

  • x: вектор или строка

result <- nchar("Google w3codebox Taobao")
print(result)

Результат выполнения вышеуказанного кода:

[1] 20

Функции toupper() и tolower()

Функции toupper() и tolower() используются для преобразования символов строки в верхний и нижний регистр.

Формат грамматики:

toupper(x)
tolower(x)

Описание параметров:

  • x: вектор или строка

# Перевести в заглавные буквы

result <- toupper("w3codebox")
print(result)
# Перевести в строчные буквы
result <- tolower("w3codebox")
print(result)

Результат выполнения вышеуказанного кода:

[1] "w3codebox"
[1] "w3codebox"

Функция substring()

Функция substring() используется для вырезания строки.

Формат грамматики:

substring(x, first, last)

Описание параметров:

  • x: вектор или строка

  • first: позиция начала вырезки

  • last: позиция окончания вырезки

# Вырезать с 2-го по 5-й символ
result <- substring("w3codebox", 2, 5)
print(result)

Результат выполнения вышеуказанного кода:

[1] "hooo"