Реализация импорта данных (CSV, Excel) в мобильное приложение
Импорт — сложнее экспорта. Когда экспортируешь, контролируешь формат сам. При импорте получаешь файл, который пользователь открыл в Excel, переименовал колонки, добавил строку-заголовок «Мои данные за 2024», сохранил в Windows-1251 и прислал через Telegram. И всё это нужно распознать и загрузить без крашей.
Разбор входящего файла — самое непредсказуемое
Определение кодировки. CSV приходит в UTF-8, UTF-8 с BOM, Windows-1251, CP866. Универсальное решение — библиотека определения кодировки: на Android juniversalchardet, на iOS — собственный анализ BOM + fallback на String.Encoding.windowsCP1251. Если кодировка не определена правильно — Клиент вместо «Клиент».
Определение разделителя. Парсер должен пробовать ,, ;, \t и выбирать тот, что даёт наибольшее количество однородных колонок. Либо дать пользователю выбрать вручную — честнее и надёжнее.
Пустые строки, дубли заголовков, смешанные типы. Реальные пользовательские файлы содержат пустые строки между блоками, объединённые ячейки в Excel, числа в колонке «дата». Каждый из этих случаев нужно обрабатывать явно, а не падать с ArrayIndexOutOfBoundsException.
Архитектура импорта
Шаг 1: Выбор файла
// Android — DocumentPicker
val launcher = registerForActivityResult(
ActivityResultContracts.GetContent()
) { uri -> uri?.let { viewModel.importFile(it) } }
launcher.launch("text/csv,application/vnd.ms-excel,application/vnd.openxmlformats-officedocument.spreadsheetml.sheet")
// iOS — UIDocumentPickerViewController
let picker = UIDocumentPickerViewController(forOpeningContentTypes: [.commaSeparatedText, .spreadsheet])
picker.delegate = self
present(picker, animated: true)
Шаг 2: Парсинг
На Android для CSV — opencsv или univocity-parsers (последний быстрее на больших файлах и корректно обрабатывает экранирование кавычек). Для .xlsx — Apache POI XSSFWorkbook.
На iOS для CSV — собственный парсер через Scanner или CSVParser из SwiftCSV. Для .xlsx — CoreXLSX (Swift Package Manager).
// Android, univocity-parsers
val settings = CsvParserSettings().apply {
isHeaderExtractionEnabled = true
format.delimiter = ';'
}
val parser = CsvParser(settings)
val rows: List<Record> = parser.parseAllRecords(inputStream.reader(Charsets.UTF_8))
Шаг 3: Валидация и маппинг
Перед записью в базу — валидация каждой строки. Не «упасть на первой ошибке», а собрать все невалидные строки и показать сводку: «Импортировано 847 из 900 строк. 53 строки пропущены — некорректный формат даты в колонке D». Пользователь должен понять, что пошло не так, и исправить файл.
data class ImportResult(
val imported: Int,
val skipped: List<SkippedRow>
)
data class SkippedRow(val line: Int, val reason: String)
Шаг 4: Запись в базу данных
Транзакция целиком — либо всё, либо ничего. На Room:
@Transaction
suspend fun importRows(rows: List<TransactionEntity>) {
database.clearAll()
database.insertAll(rows)
}
Для инкрементального импорта (добавить новые, обновить существующие) — INSERT OR REPLACE с уникальным полем-идентификатором.
UI-паттерны
Прогресс-бар с текущей строкой (Обработано 3 412 из 10 000), отмена через Job.cancel() на Android / Task cancellation на iOS. После импорта — экран с итогами: сколько добавлено, сколько обновлено, сколько пропущено с причинами.
Предпросмотр первых 5–10 строк перед подтверждением импорта — хорошая UX-практика, которая снижает количество «я не то загрузил».
Типичные ошибки
- Парсинг на main thread — ANR/freeze гарантирован на файлах от 1 МБ
- Не обработанные кавычки в CSV:
"Иванов, Иван"без экранирования ломает разбивку по запятым - Дата
01.03.2024vs2024-03-01vs3/1/24— три разных формата, все встречаются в реальных файлах
Что входит в работу
- Выбор файла через DocumentPicker (CSV, XLS, XLSX)
- Автоопределение кодировки и разделителя
- Валидация с отчётом об ошибках по строкам
- Транзакционная запись в локальную БД
- UI прогресса и предпросмотра
- Поддержка отмены импорта
Сроки
Базовый CSV-импорт с фиксированной структурой: 1–1,5 дня. С автоопределением формата, валидацией, предпросмотром и отчётом об ошибках: 3–4 дня. Стоимость зависит от сложности маппинга полей.







